Agent-guided workflows to accelerate model customization в Amazon SageMaker AI

Прослушать статью

Каждая организация имеет доступ к одним и тем же foundation models. Реальное конкурентное преимущество возникает, когда их адаптируют под собственные данные и отраслевую экспертизу. Но путь к этому сложен даже для опытных команд: нужно освоить техники fine-tuning, такие как Supervised Fine-Tuning (SFT), Direct Preference Optimization (DPO) и Reinforcement Learning Verifiable Rewards (RLVR), разбираться в разрозненных API и форматах данных для конкретных моделей, проектировать строгие оценки и управлять экспериментами, которые могут длиться месяцами.

Теперь Amazon SageMaker AI предлагает agentic-опыт, который меняет этот процесс. Разработчики описывают свой сценарий на естественном языке, а AI coding agent упрощает весь путь — от формулировки use case и подготовки данных до выбора техники, оценки и развертывания. Специализированные agent skills дают профильную экспертизу по fine-tuning для конкретного сценария, преобразованию данных в нужные форматы, оценке качества с помощью метрик LLM-as-a-Judge и гибкому развертыванию в Amazon Bedrock или на endpoints SageMaker AI. Agent skills для кастомизации моделей не только повышают продуктивность, но и снижают расход токенов. Весь сгенерированный код можно редактировать вручную, а результаты оформляются в повторно используемые артефакты, которые органично встраиваются в существующие рабочие процессы.

Особая сила этого опыта — agent Skills для кастомизации моделей. Это заранее подготовленные модульные наборы инструкций, которые кодируют глубокую экспертизу AWS и data science на всем протяжении жизненного цикла кастомизации. Когда вы описываете свой сценарий, AI coding agent активирует нужные skills и проводит его через подготовку и валидацию данных, выбор техники, настройку гиперпараметров, оценку модели и развертывание. Skills содержат специализированные знания об API SageMaker AI, ML-процессах, best practices и распространенных шаблонах, помогая coding agent давать более точные рекомендации, специфичные для SageMaker AI, и генерировать готовые к запуску ноутбуки на каждом этапе. Skills полностью настраиваются, поэтому их можно адаптировать под процессы команды, стандарты governance и предпочтения по инструментам, обеспечивая воспроизводимые организационные практики — распространенную проблему для универсальных coding assistants.

Amazon Kiro в SageMaker AI Studio JupyterLab

JupyterLab в SageMaker AI включает встроенную поддержку agentic development environment через ACP. По умолчанию Kiro, AI software development agent от Amazon, предварительно настроен в панели чата и предоставляет AI-powered автодополнение кода, помощь в отладке и интерактивную поддержку программирования прямо в среде JupyterLab. Когда вы используете coding agents в SageMaker AI JupyterLab, пространство автоматически загружает в контекст агента соответствующие SageMaker AI model customization Skills.

Кроме того, вы можете настроить другие совместимые с Agent Communication Protocol (ACP) coding agents по своему выбору, например Claude Code, что дает гибкость и позволяет работать с инструментами, которые лучше всего подходят вашему workflow. ACP-compatible агенты могут использовать ту же интеграцию SageMaker AI Skills при работе внутри SageMaker AI JupyterLab. Хотя в этом примере интеграция показана для JupyterLab, вы также можете использовать удаленный доступ к собственному IDE вне JupyterLab.

Требования

Перед началом этого руководства у вас должны быть следующие prerequisites:

Аккаунт AWS
Возможность получить доступ к SageMaker AI domain или создать его. Если у вас нет SageMaker AI domain, вы можете создать его с помощью вариантов quick setup или manual setup
Роль AWS IAM с необходимыми разрешениями
Amazon Simple Storage Service (Amazon S3) bucket
Доступ к SageMakerAI Studio JupyterLab compute space или возможность его создать. Минимального требования к типу инстанса для использования новых функций нет.
На момент публикации в SageMakerAI Studio JupyterLab требуется образ SageMaker AI Distribution версии 4.1 или выше.
Проверьте наличие или прикрепите managed policy AmazonSageMakerFullAccess к execution role вашего domain. К той же роли добавьте дополнительную inline policy для доступа к Lambda, S3 и Bedrock
Trust policy execution role в SageMakerAI Studio должна разрешать этим трем сервисам принимать роль: sagemaker.amazonaws.com, lambda.amazonaws.com, bedrock.amazonaws.com.

Обзор skills

SageMaker AI agent skills созданы в соответствии с Agent Skills open format. Agent-guided workflows для кастомизации моделей основаны на девяти модульных skills, которые покрывают весь жизненный цикл кастомизации:

Название skill	Фаза	Описание
Use Case Specification	Configuration	Структурированное выяснение, чтобы определить бизнес-проблему, пользователей и критерии успеха
Planning	Discovery	Генерирует динамический многошаговый план кастомизации, адаптированный под ваш use case
Fine-tuning Setup	Configuration, Training	Выбирает базовую модель из SageMaker AI Hub и рекомендует технику (SFT, DPO или RLVR)
Dataset Evaluation	Evaluation, Training	Проверяет формат и схему dataset перед обучением
Dataset Transformation	Data Engineering	Преобразует данные между ML форматами (OpenAI chat, SageMaker AI, Hugging Face, Amazon Nova)
Fine-tuning	Training	Генерирует training notebooks для serverless fine-tuning в SageMaker AI
Model Evaluation	Evaluation	Настраивает LLM-as-Judge evaluation со встроенными и пользовательскими метриками
Model Deployment	Deployment	Определяет путь развертывания (SageMaker AI endpoint или Bedrock) и генерирует код

Coding agent (Kiro, Claude Code, Cursor и другие) обеспечивает разговорный интерфейс, а SageMaker AI Skills управляют workflow. Когда вы взаимодействуете со своим coding agent, он активирует соответствующие skills. Это позволяет вызывать API SageMaker AI, получать доступ к S3 data sources и работать с model registries через предоставленные AWS MCP servers. Для вас генерируются Jupyter notebooks, которые выполняют каждый шаг процесса и встраиваются в существующие ML pipelines.

Поддерживаемые техники fine-tuning

Сейчас model customization skills поддерживают три техники fine-tuning и рекомендуют подходящую на этапе planning в зависимости от вашего use case.

Техника	Описание	Лучше всего подходит для
SFT (Supervised Fine-Tuning)	Обучение на парах вход/выход	Поведение, зависящее от задачи: следование инструкциям, соблюдение формата, ответы с адаптацией к предметной области
DPO (Direct Preference Optimization)	Обучение на предпочтительных и отклоненных ответах	Согласование тона, стиля и субъективных предпочтений с человеческой оценкой
RLVR (Reinforcement Learning with Verifiable Rewards)	Обучение с использованием reward functions на основе кода	Задачи, где корректность можно проверить программно

Реализация решения

Для этого решения вы дообучите small language model (SLM) на датасете FreedomIntelligence/medical-o1-reasoning-SFT, чтобы создать clinical reasoning model, которая пошагово разбирает медицинские случаи перед тем, как выдать диагноз. Это демонстрирует, как fine-tuning может специализировать универсальную модель под reasoning-задачи в конкретной предметной области. Если вы хотите попробовать другой сценарий, SageMaker AI предлагает библиотеку sample datasets для техник вроде SFT, DPO и RLVR, с которых можно начать.

Как начать

Откройте или создайте SageMaker AI Space с JupyterLab
Перейдите в SageMaker AI Studio
Откройте раздел Spaces в левой панели навигации или нажмите «Customize with agent» в model hub
Либо:
- Нажмите Create Space и выберите JupyterLab как приложение
- Откройте существующий Space, в котором есть JupyterLab

В этом материале мы начнем с Kiro и затем перейдем на Claude Code в качестве coding agent. Чтобы продолжить использовать Kiro, перейдите к разделу Planning Phase; либо перейдите к следующему разделу, чтобы увидеть, как использовать Claude Code в JupyterLab.

Начать использовать Kiro в панели чата:

Перед использованием Kiro требуется аутентификация. Панель чата проведет вас через процесс входа.

В JupyterLab откройте панель чата, нажав значок чата в правой боковой панели
Введите @, чтобы увидеть доступных агентов
Выберите @Kiro в выпадающем списке агентов. Начните задавать вопросы или просить помощи с кодом.

При первом использовании Kiro в space он попросит вас войти. Чтобы войти, следуйте инструкциям из чата или выполните следующие шаги:

В JupyterLab откройте новый терминал: File > New > Terminal
Выполните команду kiro-cli login --use-device-flow

Выберите один из трех вариантов входа в терминале:

Use for Free with Builder ID
Use for Free with Google or GitHub
Use with Pro license

Введите prompt: «I want to customize a model»

Настройка Claude Code в JupyterLab

SageMaker AI Studio поддерживает подключение дополнительных coding agents через Agent Control Protocol (ACP). Примеры агентов, поддерживающих ACP:

Claude (через claude-agent-acp)
OpenCode (через opencode CLI >= 1.0.0)
Gemini (через gemini CLI >= 0.34.0)
Codex (через codex-acp)

См. JupyterLab user guide для подробностей по установке.

Чтобы использовать Claude Code:

Установите CLI-инструмент в терминале SageMaker AI Studio JupyterLab:npm install -g @zed-industries/claude-agent-acp
Перезапустите space, выполнив команду restart-jupyter-server или перезапустив space через Studio UI. Обратите внимание: это приведет к потере всех несохраненных изменений и состояния в памяти, например активных kernels.
Выполните аутентификацию с агентом, следуя его собственному процессу входа
Выберите агента в выпадающем списке persona в панели чата JupyterLab (@Claude)

Claude Code можно использовать с большинством подписок Anthropic, включая настройку Claude Code с Amazon Bedrock в Amazon SageMaker AI Studio. Чтобы настроить Claude Code для работы с Claude через Amazon Bedrock, выполните prerequisites из руководства Claude Code, включите доступ к Bedrock model access и предоставьте execution role доступ к bedrock:InvokeModel и bedrock:InvokeModelWithResponseStream. Затем создайте следующий файл для настройки Claude Code на использование Bedrock.

~/.claude/settings.json:
{ 
 "env": { 
 "CLAUDE_CODE_USE_BEDROCK": "1" 
 } 
}

Фаза планирования

После получения пользовательского запроса coding agent не начинает выполнять задачи немедленно. Он входит в фазу planning, где определяет и активирует skills, необходимые для выполнения работы. В процессе агент генерирует workflow, который пользователи могут просмотреть и изменить. Исходя из первоначального запроса, агент распознает две релевантные области skills и активирует и skill планирования для структурирования общего workflow, и finetuning-setup skill для настройки training job. Прежде чем сгенерировать какой-либо код, агент задает точечные вопросы о готовности dataset и деталях use case, чтобы уточнить рекомендации по технике и метрикам оценки.

Fine-tune в SageMaker AI

При наличии нескольких семейств моделей и техник fine-tuning выбор правильного подхода для конкретного use case может быть непростым. Агент анализирует структуру вашего dataset и требования задачи, чтобы дать персонализированные рекомендации по модели и технике, помогая избежать дорогостоящих циклов проб и ошибок. SageMaker AI поддерживает serverless customization для семейств моделей Amazon Nova, GPT-OSS, Llama, Qwen и DeepSeek. Для этого use case мы выбрали Qwen3-0.6B, потому что его экономично обучать и развертывать, а его возможностей достаточно для domain-specific задач вроде medical reasoning.

В панели чата отправьте агенту prompt: «I want to fine-tune a model for clinical reasoning that walks through medical cases step-by-step before providing a diagnosis.»
Подтвердите план и ответьте на уточняющие вопросы агента. Агент сгенерирует training notebook, который использует SageMaker AI serverless training job с отслеживанием метрик обучения и валидации через встроенные SageMakerAI MLflow Apps.
Откройте notebook, проверьте код и запустите ячейки notebook, чтобы отправить training job.
Отслеживайте выполнение job в SageMaker AI Studio.

Loss модели будет стабильно снижаться в ходе обучения, что показывает: модель успешно научилась давать пошаговое clinical reasoning перед постановкой диагноза. Чтобы глубже посмотреть на полный набор метрик и разбивку по шагам, можно открыть MLflow app.

Training job results in SageMaker Studio

Оценка

После завершения обучения нужно измерить, насколько хорошо fine-tuned model работает по сравнению с базовой моделью. Агент рекомендует подход к оценке, исходя из нашего use case, или мы можем задать метрики, которые нас интересуют, например точность на отложенных вопросах по medical reasoning или улучшение reward score по сравнению с базовой моделью. Затем он генерирует notebook в SageMaker AI Studio JupyterLab, который запускает оценку на evaluation dataset и выводит результаты, чтобы мы могли проверить качество модели. Результаты оценки также отправляются в MLflow для сравнения перед переходом к deployment.

Развертывание

После завершения оценки финальный шаг — развернуть fine-tuned model для inference. Агент проводит нас по вариантам deployment в SageMaker AI и Bedrock через Bedrock Custom Model Import в зависимости от требований к latency, масштабированию и интеграции. Затем он генерирует notebook в JupyterLab, который создает endpoint и выполняет пример inference-запроса, чтобы мы могли проверить, готова ли развернутая модель обслуживать предсказания.

Настройка skills

Skills, входящие в SageMaker AI, покрывают типовые workflows fine-tuning, но вы также можете доработать существующие skills или создать новые, чтобы они соответствовали стандартам и инструментам вашей организации. Например, можно расширить skill оценки модели, добавив domain-specific метрики, или создать новый skill для собственного целевого пути развертывания. Skills определяются в простых markdown-файлах в каталоге ~/.kiro/skills, поэтому их легко создавать, версионировать и распространять внутри организации.

Заключение

В этом материале мы прошли весь жизненный цикл кастомизации модели с использованием SageMaker AI agent skills. Начиная с одного запроса на естественном языке, агент спланировал workflow, настроил и запустил SFT fine-tuning job на Qwen3-0.6B, оценил результаты по метрикам, подобранным под наш use case, и развернул дообученную модель. Agentic model customization в Amazon SageMaker AI доступен уже сегодня. Начать можно за минуты: достаточно запустить JupyterLab space в SageMaker Studio с предварительно настроенными Kiro и Agent Skills или перенести те же Skills в предпочитаемый IDE из GitHub. Опишите свой use case на естественном языке, и пусть агент проведет вас от подготовки данных до оценки и deployment.

То, что раньше требовало месяцев специализированной ML-работы и глубоких знаний, теперь можно выполнить за дни. Экспертиза закодирована. Workflow управляется. А код принадлежит вам. Начните сегодня, посетив GitHub repository плагина SageMaker AI agent skills и пошаговое руководство. Ознакомьтесь с документацией, чтобы увидеть, как serverless model customization в SageMaker AI с agent skills может ускорить путь от идеи до production models.

Материал — перевод статьи с английского.

Оригинал: Agent-guided workflows to accelerate model customization in Amazon SageMaker AI

Подписаться на новости в Telegram