OpenAI обновила Agents SDK: нативный sandbox, Manifest и более мощный harness

Прослушать статью

Обновленный Agents SDK помогает разработчикам создавать агентов, которые могут просматривать файлы, запускать команды, редактировать код и работать над долгими задачами в контролируемых sandbox-окружениях.

Например, разработчики могут дать агенту управляемое рабочее пространство, явные инструкции и инструменты, необходимые для изучения доказательств:

Python

1# pip install «openai-agents>=0.14.0″23import asyncio4import tempfile5from pathlib import Path67from agents import Runner8from agents.run import RunConfig9from agents.sandbox import Manifest, SandboxAgent, SandboxRunConfig10from agents.sandbox.entries import LocalDir11from agents.sandbox.sandboxes import UnixLocalSandboxClient121314async def main() -> None:15 with tempfile.TemporaryDirectory() as tmp:16 dataroom = Path(tmp) / «dataroom»17 dataroom.mkdir()18 (dataroom / «metrics.md»).write_text(19 «»»# Annual metrics2021| Year | Revenue | Operating income | Operating cash flow |22| — | —: | —: | —: |23| FY2025 | $124.3M | $18.6M | $24.1M |24| FY2024 | $98.7M | $12.4M | $17.9M |25″»»,26 encoding=»utf-8″,27 )2829 agent = SandboxAgent(30 name=»Dataroom Analyst»,31 model=»gpt-5.4″,32 instructions=»Answer using only files in data/. Cite source filenames.»,33 default_manifest=Manifest(entries={«data»: LocalDir(src=dataroom)}),34 )3536 result = await Runner.run(37 agent,38 «Compare FY2025 revenue, operating income, and operating cash flow with FY2024.»,39 run_config=RunConfig(40 sandbox=SandboxRunConfig(client=UnixLocalSandboxClient()),41 ),42 )43 print(result.final_output)444546if _name_ == «_main_«:47 asyncio.run(main())48

Разработчикам для создания полезных агентов нужны не только лучшие модели — им нужны системы, которые поддерживают то, как агенты просматривают файлы, запускают команды, пишут код и продолжают работу на протяжении многих шагов.

Существующие сегодня системы имеют компромиссы по мере перехода команд от прототипов к продакшену. Платформонезависимые фреймворки гибки, но не полностью используют возможности frontier-моделей; SDK от провайдера модели могут быть ближе к модели, но часто не дают достаточной видимости в harness; а управляемые API для агентов могут упрощать развертывание, но ограничивают, где агенты запускаются и как они получают доступ к чувствительным данным.

Вот что сказали некоторые клиенты, протестировавшие новый SDK вместе с нами:

Oscar Health Actively LexisNexis FurtherAI Thomson Reuters Zoom Tomoro AI

«Обновленный Agents SDK сделал решение жизнеспособным для продакшена и позволил нам автоматизировать критически важный workflow по клиническим записям, с которым предыдущие подходы не могли надежно справиться. Для нас разница была не только в извлечении нужных метаданных, но и в корректном понимании границ каждого эпизода в длинных, сложных записях. В результате мы быстрее понимаем, что происходит с каждым пациентом во время конкретного визита, лучше помогаем участникам с их потребностями в уходе и улучшаем их опыт взаимодействия с нами».

— Rachael Burns, Staff Engineer & AI Tech Lead, Oscar Health

Более мощный harness для agent loop

С сегодняшним релизом harness в Agents SDK становится более мощным для агентов, которые работают с документами, файлами и системами. Теперь он включает настраиваемую память, orchestration с учетом sandbox, файловые инструменты в стиле Codex и стандартизированные интеграции с примитивами, которые становятся обычными в frontier-agent-системах.

Harness также помогает разработчикам раскрывать больше возможностей frontier-модели, согласуя выполнение с тем, как такие модели работают лучше всего. Это удерживает агентов ближе к естественному режиму работы модели, повышая надежность и производительность на сложных задачах — особенно когда работа длительная или скоординирована между разными инструментами и системами.

Кроме того, мы понимаем, что каждый продукт уникален и редко укладывается в один шаблон. Мы разработали Agents SDK так, чтобы он поддерживал это разнообразие. Разработчики получают harness, который готов к использованию, но при этом остается гибким, что упрощает адаптацию под собственный стек — включая использование инструментов, память и sandbox-окружение.

Нативное выполнение в sandbox

Обновленный Agents SDK нативно поддерживает выполнение в sandbox, так что агенты могут работать в контролируемых компьютерных окружениях с файлами, инструментами и зависимостями, необходимыми для задачи.

Многим полезным агентам нужен рабочий простор, где они могут читать и писать файлы, устанавливать зависимости, запускать код и безопасно использовать инструменты. Нативная поддержка sandbox дает разработчикам этот слой выполнения из коробки вместо того, чтобы собирать его самостоятельно.

Разработчики могут использовать собственный sandbox или встроенную поддержку Blaxel, Cloudflare, Daytona, E2B, Modal, Runloop и Vercel.

Чтобы сделать такие окружения переносимыми между провайдерами, SDK также вводит абстракцию Manifest для описания рабочего пространства агента. Разработчики могут монтировать локальные файлы, задавать каталоги вывода и подключать данные из хранилищ, включая AWS S3, Google Cloud Storage, Azure Blob Storage и Cloudflare R2.

Это дает разработчикам единообразный способ формировать окружение агента — от локального прототипа до продакшен-развертывания. Это также дает модели предсказуемое рабочее пространство: где искать входные данные, куда записывать результаты и как поддерживать порядок работы в течение долгой задачи.

Разделение harness и compute ради безопасности, устойчивости и масштаба

Системы агентов следует проектировать, исходя из предположения о prompt injection и попытках exfiltration. Разделение harness и compute помогает не держать credentials в окружениях, где выполняется сгенерированный моделью код.

Это также обеспечивает durable execution. Когда состояние агента выносится наружу, потеря sandbox-контейнера не означает потерю выполнения. Благодаря встроенным snapshotting и rehydration Agents SDK может восстановить состояние агента в новом контейнере и продолжить с последней контрольной точки, если исходное окружение выйдет из строя или истечет.

Наконец, это делает агентов более масштабируемыми. Запуски агентов могут использовать один sandbox или несколько, вызывать sandbox только при необходимости, направлять subagents в изолированные окружения и параллелить работу между контейнерами для более быстрого выполнения.

Цены и доступность

Новые возможности Agents SDK в целом доступны всем клиентам через API и тарифицируются по стандартным API-тарифам — на основе токенов и использования инструментов.

Что дальше

По мере дальнейшего развития Agents SDK мы продолжим расширять то, что разработчики могут на его основе строить, делая проще вывод более мощных агентов в продакшен с меньшим количеством собственной инфраструктуры и при этом сохраняя гибкость и контроль, необходимые для интеграции агентов в собственные окружения.

Новые возможности harness и sandbox сначала выходят в Python, а поддержка TypeScript планируется в будущей версии. Мы также работаем над тем, чтобы добавить дополнительные возможности агентов, включая code mode и subagents, и в Python, и в TypeScript.

Кроме того, мы хотим со временем объединять более широкую agent-экосистему, добавляя поддержку большего числа sandbox-провайдеров, большего количества интеграций и новых способов подключать SDK к инструментам и системам, которые разработчики уже используют.

Автор

Читать далее

Codex теперь предлагает оплату по мере использования для команд Product Apr 2, 2026

Улучшение обнаружения продуктов в ChatGPT Product Mar 24, 2026

Представляем GPT-5.4 mini и nano Company Mar 17, 2026


Материал — перевод статьи с английского.

Оригинал: The next evolution of the Agents SDK