Databricks добавляет GPT-5.5 в корпоративные агентные workflows — ИИ для бизнеса

Databricks добавляет GPT-5.5 в корпоративные агентные workflows

Прослушать статью

Databricks добавляет GPT-5.5 в корпоративные агентные workflows | OpenAI

15 мая 2026 года

GPT‑5.5 показала новый state of the art на OfficeQA Pro, бенчмарке Databricks для сложных корпоративных агентных задач.

Размер компании: Enterprise

Регион: North America

Отрасль: Technology

Продукты: Codex

50%

Точность на бенчмарке OfficeQA Pro (state of the art)

46%

Сокращение числа ошибок на бенчмарке OfficeQA Pro по сравнению с GPT-5.4

Слушать статью

Databricks теперь делает GPT‑5.5 доступной для клиентских agent workflows после того, как модель установила новый state of the art на OfficeQA Pro — внутреннем бенчмарке компании для сложных корпоративных задач с документами.

OfficeQA Pro оценивает, как модели справляются с parsing, retrieval и grounded reasoning в workflows со сканированными PDF, legacy-файлами и длинноконтекстными документами — задачами, которые часто ломают production agent systems.

В agent-harness-режиме GPT‑5.5 сократила число ошибок на 46% по сравнению с GPT‑5.4 и стала первой моделью, превысившей 50% точности на OfficeQA Pro.

«Codex with 5.5 теперь state-of-the-art среди всех агентов и моделей».

—Arnav Singhvi, Research Engineer

SOTA-производительность на OfficeQA Pro

OfficeQA Pro включает большое количество сканированных или legacy корпоративных документов, где небольшие ошибки извлечения при parsing могут каскадно распространяться на весь последующий workflow. «Как только вы не можете извлечь определённую цифру или число, это меняет всю траекторию того, с чем работает агент», — объясняет Singhvi.

Databricks увидела наибольший прирост от GPT‑5.5 именно в этих parsing-heavy workflows. «Ранние модели вроде 5.4 не могли корректно разобрать все цифры, но, похоже, у 5.5 есть скачкообразное улучшение в работе со старыми документами и сканированными PDF», — говорит Singhvi.

Команда также заметила улучшения в orchestration при многошаговых задачах. «Одна вещь, которую мы наблюдали у 5.4, — иногда она уходила в ненужные search detours, и это приводило к очень неэффективным траекториям», — говорит Singhvi.

По сравнению с более ранними моделями GPT‑5.5 лучше находила релевантный контекст и выполняла сложные workflows без дополнительного supervision.

Внедрение GPT‑5.5 в production workflows

Теперь Databricks делает GPT‑5.5 доступной через AI Unity Gateway, где клиенты используют модель внутри workflows, построенных с помощью AgentBricks и Agent Supervisor API. В этих системах GPT‑5.5 координирует parsing, retrieval и execution между специализированными агентами.

«Мы увидим много клиентов, использующих AgentBricks и Agent Supervisor API для кастомных agent workflows, — говорит Singhvi. — Иметь GPT‑5.5 в роли supervisor для этих workflows очень интересно».

«GPT-5.5 была отличной с точки зрения knowledge lift. Для нас это скачкообразное изменение в выполнении knowledge work».

—Arnav Singhvi, Research Engineer


Материал — перевод статьи с английского.

Оригинал: Databricks brings GPT-5.5 to enterprise agent workflows