Oracle запускает Trusted Answer Search для семантического поиска без LLMs

Прослушать статью

Trusted Answer Search — новый продукт Oracle, который делает ставку на контроль, аудируемость и предсказуемый результат вместо генеративной гибкости. Это позволяет экономить вычислительные ресурсы, но увеличивает затраты на курирование данных и управление ими.

Oracle утверждает, что новый Trusted Answer Search способен выдавать надежные результаты в enterprise-масштабе, просматривая управляемый набор одобренных документов с помощью векторного поиска вместо больших языковых моделей (LLMs) и retrieval-augmented generation (RAG).

Решение можно скачать или использовать через API. Для работы предприятия должны определить курируемое «поисковое пространство» из одобренных отчетов, документов или конечных точек приложений, дополненных метаданными, а затем с помощью векторного сравнения сопоставлять естественно-языковой запрос пользователя с наиболее подходящей предварительно одобренной целью, сказал Tirthankar Lahiri, старший вице-президент Oracle по критически важным данным и AI engines.

Вместо извлечения сырого текста и генерации ответа, как это обычно происходит в системах RAG, зависящих от LLMs, базовая система Trusted Answer Search детерминированно сопоставляет запрос с конкретным «документом-соответствием», извлекает нужные параметры и возвращает структурированный, проверяемый результат — например, отчет, URL или действие, отметил Lahiri.

Петля обратной связи позволяет пользователям помечать неверные совпадения и указывать ожидаемый результат.

Lahiri видит растущую потребность enterprise в более детерминированных системах естественно-языковых запросов, которые убирают непоследовательные ответы и обеспечивают аудируемость для нужд compliance.

Независимый консультант David Linthicum согласился, что для Trusted Answer Search есть потенциальный рынок.

«Покупатель — это любое предприятие, для которого предсказуемость важнее креативности и которое хочет снизить операционный риск, особенно в регулируемых отраслях, таких как финансы и здравоохранение», — сказал он.

Компромиссы

При этом подход предполагает компромиссы, которые CIO должны учитывать, отметил Robert Kramer, управляющий партнер KramerERP. Хотя Trusted Answer Search может сократить затраты на inference за счет отказа от интенсивного использования LLMs, он переносит расходы в сторону курирования данных, governance и постоянного сопровождения, сказал он.

По словам Linthicum, предприятия, внедряющие такую технологию, тоже будут тратиться на курирование документов, проектирование таксономии, согласования, change management и постоянную настройку.

Scott Bickley, advisory fellow в Info-Tech Research Group, предупредил о сложности поддержания курируемых данных в актуальном состоянии.

«По мере того как исходные данные масштабируются и включают внешние источники, такие как регуляторные обновления, сертификаты поставщиков или рыночные обновления, которые меняются чаще, а число документов может достигать многих тысяч, риск растет», — сказал он.

«Проблема сводится к способности давать точные ответы по огромному набору данных, особенно когда документы могут противоречить друг другу между версиями или когда похожий язык в регуляторном контексте означает разное. Риск получить правдоподобный, но неверный результат возрастает», — добавил Bickley.

Lahiri, однако, сказал, что часть этих рисков можно снизить тем, как Trusted Answer Search извлекает контент.

Вместо того чтобы опираться только на большие массивы статических, курируемых документов, требующих постоянного обновления, система может рассматривать «доверенные документы» как параметризованные URL, которые подтягивают динамически отрисованный контент из базовых систем, пояснил Lahiri.

Источники живых данных

Это позволяет формировать ответы из живых источников данных, таких как корпоративные приложения, API или регулярно обновляемые веб-конечные точки, уменьшая зависимость от вручную поддерживаемых репозиториев документов, сказал он.

Linthicum не до конца убедили аргументы Lahiri, хотя он согласился, что подход Oracle может помочь сократить churn контента.

«В быстро меняющихся доменах поддержание актуальности описаний, синонимов и сопоставлений по-прежнему требует дисциплинированных владельцев, согласований и анализа обратной связи. Решение можно масштабировать до тысяч целей, но семантическое перекрытие усложняет сопровождение», — сказал он.

Trusted Answer Search выводит Oracle в конкуренцию с предложениями других гиперскейлеров. Такие продукты, как Amazon Kendra, Azure AI Search, Vertex AI Search и IBM Watson Discovery, уже поддерживают семантический поиск по корпоративным данным, часто в сочетании с контролем доступа и гибридными техниками извлечения.

Одно ключевое отличие между этими решениями и Oracle, по словам Ashish Chaturvedi, руководителя executive research в HFS Research, в том, что решения конкурентов обычно накладывают сверху возможности generative AI, чтобы формировать ответы.

Компании могут оценить Trusted Answer Search, скачав пакет, который включает компоненты вроде векторного поиска, embedding model для обработки пользовательских запросов и API для интеграции в существующие приложения и интерфейсы. Его также можно использовать через API или встроенные GUI-приложения, включенные в пакет как два приложения на базе APEX: интерфейс администратора для управления системой и портал для конечных пользователей.

Материал — перевод статьи с английского.

Оригинал: Oracle delivers semantic search without LLMs

Подписаться на новости в Telegram