Agent-guided workflows to accelerate model customization в Amazon SageMaker AI
Каждая организация имеет доступ к одним и тем же foundation models. Реальное конкурентное преимущество возникает, когда их адаптируют под собственные данные и отраслевую экспертизу. Но путь к этому сложен даже для опытных команд: нужно освоить техники fine-tuning, такие как Supervised Fine-Tuning (SFT), Direct Preference Optimization (DPO) и Reinforcement Learning Verifiable Rewards (RLVR), разбираться в разрозненных API и форматах данных для конкретных моделей, проектировать строгие оценки и управлять экспериментами, которые могут длиться месяцами.
Теперь Amazon SageMaker AI предлагает agentic-опыт, который меняет этот процесс. Разработчики описывают свой сценарий на естественном языке, а AI coding agent упрощает весь путь — от формулировки use case и подготовки данных до выбора техники, оценки и развертывания. Специализированные agent skills дают профильную экспертизу по fine-tuning для конкретного сценария, преобразованию данных в нужные форматы, оценке качества с помощью метрик LLM-as-a-Judge и гибкому развертыванию в Amazon Bedrock или на endpoints SageMaker AI. Agent skills для кастомизации моделей не только повышают продуктивность, но и снижают расход токенов. Весь сгенерированный код можно редактировать вручную, а результаты оформляются в повторно используемые артефакты, которые органично встраиваются в существующие рабочие процессы.
Особая сила этого опыта — agent Skills для кастомизации моделей. Это заранее подготовленные модульные наборы инструкций, которые кодируют глубокую экспертизу AWS и data science на всем протяжении жизненного цикла кастомизации. Когда вы описываете свой сценарий, AI coding agent активирует нужные skills и проводит его через подготовку и валидацию данных, выбор техники, настройку гиперпараметров, оценку модели и развертывание. Skills содержат специализированные знания об API SageMaker AI, ML-процессах, best practices и распространенных шаблонах, помогая coding agent давать более точные рекомендации, специфичные для SageMaker AI, и генерировать готовые к запуску ноутбуки на каждом этапе. Skills полностью настраиваются, поэтому их можно адаптировать под процессы команды, стандарты governance и предпочтения по инструментам, обеспечивая воспроизводимые организационные практики — распространенную проблему для универсальных coding assistants.
Amazon Kiro в SageMaker AI Studio JupyterLab
JupyterLab в SageMaker AI включает встроенную поддержку agentic development environment через ACP. По умолчанию Kiro, AI software development agent от Amazon, предварительно настроен в панели чата и предоставляет AI-powered автодополнение кода, помощь в отладке и интерактивную поддержку программирования прямо в среде JupyterLab. Когда вы используете coding agents в SageMaker AI JupyterLab, пространство автоматически загружает в контекст агента соответствующие SageMaker AI model customization Skills.
Кроме того, вы можете настроить другие совместимые с Agent Communication Protocol (ACP) coding agents по своему выбору, например Claude Code, что дает гибкость и позволяет работать с инструментами, которые лучше всего подходят вашему workflow. ACP-compatible агенты могут использовать ту же интеграцию SageMaker AI Skills при работе внутри SageMaker AI JupyterLab. Хотя в этом примере интеграция показана для JupyterLab, вы также можете использовать удаленный доступ к собственному IDE вне JupyterLab.
Требования
Перед началом этого руководства у вас должны быть следующие prerequisites:
- Аккаунт AWS
- Возможность получить доступ к SageMaker AI domain или создать его. Если у вас нет SageMaker AI domain, вы можете создать его с помощью вариантов quick setup или manual setup
- Роль AWS IAM с необходимыми разрешениями
- Amazon Simple Storage Service (Amazon S3) bucket
- Доступ к SageMakerAI Studio JupyterLab compute space или возможность его создать. Минимального требования к типу инстанса для использования новых функций нет.
- На момент публикации в SageMakerAI Studio JupyterLab требуется образ SageMaker AI Distribution версии 4.1 или выше.
- Проверьте наличие или прикрепите managed policy AmazonSageMakerFullAccess к execution role вашего domain. К той же роли добавьте дополнительную inline policy для доступа к Lambda, S3 и Bedrock
- Trust policy execution role в SageMakerAI Studio должна разрешать этим трем сервисам принимать роль: sagemaker.amazonaws.com, lambda.amazonaws.com, bedrock.amazonaws.com.
Обзор skills
SageMaker AI agent skills созданы в соответствии с Agent Skills open format. Agent-guided workflows для кастомизации моделей основаны на девяти модульных skills, которые покрывают весь жизненный цикл кастомизации:
| Название skill | Фаза | Описание |
| Use Case Specification | Configuration | Структурированное выяснение, чтобы определить бизнес-проблему, пользователей и критерии успеха |
| Planning | Discovery | Генерирует динамический многошаговый план кастомизации, адаптированный под ваш use case |
| Fine-tuning Setup | Configuration, Training | Выбирает базовую модель из SageMaker AI Hub и рекомендует технику (SFT, DPO или RLVR) |
| Dataset Evaluation | Evaluation, Training | Проверяет формат и схему dataset перед обучением |
| Dataset Transformation | Data Engineering | Преобразует данные между ML форматами (OpenAI chat, SageMaker AI, Hugging Face, Amazon Nova) |
| Fine-tuning | Training | Генерирует training notebooks для serverless fine-tuning в SageMaker AI |
| Model Evaluation | Evaluation | Настраивает LLM-as-Judge evaluation со встроенными и пользовательскими метриками |
| Model Deployment | Deployment | Определяет путь развертывания (SageMaker AI endpoint или Bedrock) и генерирует код |
Coding agent (Kiro, Claude Code, Cursor и другие) обеспечивает разговорный интерфейс, а SageMaker AI Skills управляют workflow. Когда вы взаимодействуете со своим coding agent, он активирует соответствующие skills. Это позволяет вызывать API SageMaker AI, получать доступ к S3 data sources и работать с model registries через предоставленные AWS MCP servers. Для вас генерируются Jupyter notebooks, которые выполняют каждый шаг процесса и встраиваются в существующие ML pipelines.
Поддерживаемые техники fine-tuning
Сейчас model customization skills поддерживают три техники fine-tuning и рекомендуют подходящую на этапе planning в зависимости от вашего use case.
| Техника | Описание | Лучше всего подходит для |
| SFT (Supervised Fine-Tuning) | Обучение на парах вход/выход | Поведение, зависящее от задачи: следование инструкциям, соблюдение формата, ответы с адаптацией к предметной области |
| DPO (Direct Preference Optimization) | Обучение на предпочтительных и отклоненных ответах | Согласование тона, стиля и субъективных предпочтений с человеческой оценкой |
| RLVR (Reinforcement Learning with Verifiable Rewards) | Обучение с использованием reward functions на основе кода | Задачи, где корректность можно проверить программно |
Реализация решения
Для этого решения вы дообучите small language model (SLM) на датасете FreedomIntelligence/medical-o1-reasoning-SFT, чтобы создать clinical reasoning model, которая пошагово разбирает медицинские случаи перед тем, как выдать диагноз. Это демонстрирует, как fine-tuning может специализировать универсальную модель под reasoning-задачи в конкретной предметной области. Если вы хотите попробовать другой сценарий, SageMaker AI предлагает библиотеку sample datasets для техник вроде SFT, DPO и RLVR, с которых можно начать.
Как начать
- Откройте или создайте SageMaker AI Space с JupyterLab
- Перейдите в SageMaker AI Studio
- Откройте раздел Spaces в левой панели навигации или нажмите «Customize with agent» в model hub
- Либо:
- Нажмите Create Space и выберите JupyterLab как приложение
- Откройте существующий Space, в котором есть JupyterLab
В этом материале мы начнем с Kiro и затем перейдем на Claude Code в качестве coding agent. Чтобы продолжить использовать Kiro, перейдите к разделу Planning Phase; либо перейдите к следующему разделу, чтобы увидеть, как использовать Claude Code в JupyterLab.
Начать использовать Kiro в панели чата:
Перед использованием Kiro требуется аутентификация. Панель чата проведет вас через процесс входа.
- В JupyterLab откройте панель чата, нажав значок чата в правой боковой панели

- Введите @, чтобы увидеть доступных агентов
- Выберите @Kiro в выпадающем списке агентов. Начните задавать вопросы или просить помощи с кодом.

При первом использовании Kiro в space он попросит вас войти. Чтобы войти, следуйте инструкциям из чата или выполните следующие шаги:
- В JupyterLab откройте новый терминал: File > New > Terminal
- Выполните команду
kiro-cli login --use-device-flow
Выберите один из трех вариантов входа в терминале:
- Use for Free with Builder ID
- Use for Free with Google or GitHub
- Use with Pro license
- Введите prompt: «I want to customize a model»

Настройка Claude Code в JupyterLab
SageMaker AI Studio поддерживает подключение дополнительных coding agents через Agent Control Protocol (ACP). Примеры агентов, поддерживающих ACP:
- Claude (через claude-agent-acp)
- OpenCode (через opencode CLI >= 1.0.0)
- Gemini (через gemini CLI >= 0.34.0)
- Codex (через codex-acp)
См. JupyterLab user guide для подробностей по установке.
Чтобы использовать Claude Code:
- Установите CLI-инструмент в терминале SageMaker AI Studio JupyterLab:
npm install -g @zed-industries/claude-agent-acp - Перезапустите space, выполнив команду
restart-jupyter-serverили перезапустив space через Studio UI. Обратите внимание: это приведет к потере всех несохраненных изменений и состояния в памяти, например активных kernels. - Выполните аутентификацию с агентом, следуя его собственному процессу входа
- Выберите агента в выпадающем списке persona в панели чата JupyterLab (@Claude)

Claude Code можно использовать с большинством подписок Anthropic, включая настройку Claude Code с Amazon Bedrock в Amazon SageMaker AI Studio. Чтобы настроить Claude Code для работы с Claude через Amazon Bedrock, выполните prerequisites из руководства Claude Code, включите доступ к Bedrock model access и предоставьте execution role доступ к bedrock:InvokeModel и bedrock:InvokeModelWithResponseStream. Затем создайте следующий файл для настройки Claude Code на использование Bedrock.
~/.claude/settings.json:
{
"env": {
"CLAUDE_CODE_USE_BEDROCK": "1"
}
}
Фаза планирования
После получения пользовательского запроса coding agent не начинает выполнять задачи немедленно. Он входит в фазу planning, где определяет и активирует skills, необходимые для выполнения работы. В процессе агент генерирует workflow, который пользователи могут просмотреть и изменить. Исходя из первоначального запроса, агент распознает две релевантные области skills и активирует и skill планирования для структурирования общего workflow, и finetuning-setup skill для настройки training job. Прежде чем сгенерировать какой-либо код, агент задает точечные вопросы о готовности dataset и деталях use case, чтобы уточнить рекомендации по технике и метрикам оценки.
Fine-tune в SageMaker AI
При наличии нескольких семейств моделей и техник fine-tuning выбор правильного подхода для конкретного use case может быть непростым. Агент анализирует структуру вашего dataset и требования задачи, чтобы дать персонализированные рекомендации по модели и технике, помогая избежать дорогостоящих циклов проб и ошибок. SageMaker AI поддерживает serverless customization для семейств моделей Amazon Nova, GPT-OSS, Llama, Qwen и DeepSeek. Для этого use case мы выбрали Qwen3-0.6B, потому что его экономично обучать и развертывать, а его возможностей достаточно для domain-specific задач вроде medical reasoning.
- В панели чата отправьте агенту prompt: «I want to fine-tune a model for clinical reasoning that walks through medical cases step-by-step before providing a diagnosis.»
- Подтвердите план и ответьте на уточняющие вопросы агента. Агент сгенерирует training notebook, который использует SageMaker AI serverless training job с отслеживанием метрик обучения и валидации через встроенные SageMakerAI MLflow Apps.
- Откройте notebook, проверьте код и запустите ячейки notebook, чтобы отправить training job.
- Отслеживайте выполнение job в SageMaker AI Studio.
Loss модели будет стабильно снижаться в ходе обучения, что показывает: модель успешно научилась давать пошаговое clinical reasoning перед постановкой диагноза. Чтобы глубже посмотреть на полный набор метрик и разбивку по шагам, можно открыть MLflow app.

Оценка
После завершения обучения нужно измерить, насколько хорошо fine-tuned model работает по сравнению с базовой моделью. Агент рекомендует подход к оценке, исходя из нашего use case, или мы можем задать метрики, которые нас интересуют, например точность на отложенных вопросах по medical reasoning или улучшение reward score по сравнению с базовой моделью. Затем он генерирует notebook в SageMaker AI Studio JupyterLab, который запускает оценку на evaluation dataset и выводит результаты, чтобы мы могли проверить качество модели. Результаты оценки также отправляются в MLflow для сравнения перед переходом к deployment.
Развертывание
После завершения оценки финальный шаг — развернуть fine-tuned model для inference. Агент проводит нас по вариантам deployment в SageMaker AI и Bedrock через Bedrock Custom Model Import в зависимости от требований к latency, масштабированию и интеграции. Затем он генерирует notebook в JupyterLab, который создает endpoint и выполняет пример inference-запроса, чтобы мы могли проверить, готова ли развернутая модель обслуживать предсказания.
Настройка skills
Skills, входящие в SageMaker AI, покрывают типовые workflows fine-tuning, но вы также можете доработать существующие skills или создать новые, чтобы они соответствовали стандартам и инструментам вашей организации. Например, можно расширить skill оценки модели, добавив domain-specific метрики, или создать новый skill для собственного целевого пути развертывания. Skills определяются в простых markdown-файлах в каталоге ~/.kiro/skills, поэтому их легко создавать, версионировать и распространять внутри организации.
Заключение
В этом материале мы прошли весь жизненный цикл кастомизации модели с использованием SageMaker AI agent skills. Начиная с одного запроса на естественном языке, агент спланировал workflow, настроил и запустил SFT fine-tuning job на Qwen3-0.6B, оценил результаты по метрикам, подобранным под наш use case, и развернул дообученную модель. Agentic model customization в Amazon SageMaker AI доступен уже сегодня. Начать можно за минуты: достаточно запустить JupyterLab space в SageMaker Studio с предварительно настроенными Kiro и Agent Skills или перенести те же Skills в предпочитаемый IDE из GitHub. Опишите свой use case на естественном языке, и пусть агент проведет вас от подготовки данных до оценки и deployment.
То, что раньше требовало месяцев специализированной ML-работы и глубоких знаний, теперь можно выполнить за дни. Экспертиза закодирована. Workflow управляется. А код принадлежит вам. Начните сегодня, посетив GitHub repository плагина SageMaker AI agent skills и пошаговое руководство. Ознакомьтесь с документацией, чтобы увидеть, как serverless model customization в SageMaker AI с agent skills может ускорить путь от идеи до production models.
Материал — перевод статьи с английского.
Оригинал: Agent-guided workflows to accelerate model customization in Amazon SageMaker AI