Жизненный цикл моделей Amazon Bedrock: активные, устаревающие и снятые с поддержки (EOL)

Amazon Bedrock регулярно выпускает новые версии foundation model (FM) с улучшенными возможностями, точностью и безопасностью. Понимание жизненного цикла моделей важно для эффективного планирования и управления AI-приложениями, построенными на Amazon Bedrock. Перед миграцией приложений вы можете протестировать эти модели через консоль Amazon Bedrock или API, чтобы оценить их производительность и совместимость.

В этой статье показано, как управлять переходами FM в Amazon Bedrock, чтобы ваши AI-приложения оставались работоспособными по мере развития моделей. Мы рассмотрим три состояния жизненного цикла, способы планирования миграции с новой функцией extended access и практические стратегии перехода на более новые модели без сбоев.

Обзор жизненного цикла моделей Amazon Bedrock

Модель, доступная в Amazon Bedrock, может находиться в одном из трех состояний: Active, Legacy или End-of-Life (EOL). Текущий статус виден как в консоли Amazon Bedrock, так и в ответах API. Например, при вызове GetFoundationModel или ListFoundationModels состояние модели будет указано в поле modelLifecycle в ответе.

На следующей диаграмме показаны особенности каждого состояния модели.

Описание состояний:

  • ACTIVE — Активные модели получают от своих поставщиков постоянное обслуживание, обновления и исправления ошибок. Пока модель находится в состоянии Active, вы можете использовать ее для инференса через такие API, как InvokeModel или Converse, настраивать ее, если это поддерживается, и запрашивать увеличение квот через AWS Service Quotas.
  • LEGACY — Когда поставщик переводит модель в состояние Legacy, Amazon Bedrock уведомляет клиентов как минимум за 6 месяцев до даты EOL, предоставляя достаточно времени для планирования и выполнения миграции на более новую или альтернативную версию модели. В период Legacy существующие клиенты могут продолжать использовать модель, хотя новым клиентам доступ к ней может быть недоступен, а существующие клиенты могут потерять доступ для неактивных аккаунтов, если не вызывают модель в течение 15 дней или более. Организациям следует учитывать, что создание нового provisioned throughput по model units становится недоступным, а возможности настройки модели могут быть ограничены. Для моделей с датой EOL позже 1 февраля 2026 года Amazon Bedrock вводит дополнительную фазу внутри состояния Legacy:
    • Public extended access period — После минимальных 3 месяцев в состоянии Legacy модель переходит в эту фазу расширенного доступа. Активные пользователи могут продолжать использовать ее как минимум еще 3 месяца до EOL. В период extended access запросы на увеличение квоты через AWS Service Quotas, как ожидается, не будут одобряться, поэтому планируйте потребности в мощности до того, как модель войдет в эту фазу. В этот период провайдер может изменить цены (см. раздел Pricing during extended access ниже), а клиенты получат уведомления о дате перехода и любых изменениях.
  • END-OF-LIFE (EOL) — Когда модель достигает даты EOL, она становится полностью недоступной во всех регионах AWS, если иное не указано в списке EOL. API-запросы к моделям EOL будут завершаться ошибкой, и модель станет недоступной для большинства клиентов, если между клиентом и провайдером нет специальных соглашений о продолжении доступа. Переход в EOL требует активных действий со стороны клиента — миграция не происходит автоматически. Организациям необходимо обновить код приложения, чтобы использовать альтернативные модели до наступления даты EOL. Когда наступает EOL, модель становится полностью недоступной для большинства клиентов.

После запуска модели в Amazon Bedrock она остается доступной как минимум 12 месяцев после релиза и находится в состоянии Legacy как минимум 6 месяцев до EOL. Такой график помогает клиентам планировать миграцию без спешки.

Ценообразование в период extended access

В период extended access провайдер модели может изменить цену. Если такие изменения запланированы, вы будете уведомлены в первоначальном объявлении о переходе в Legacy и до вступления в силу любых последующих изменений, поэтому ретроактивного повышения цен не будет. Клиенты с действующими частными ценовыми соглашениями с провайдерами моделей или использующие provisioned throughput продолжат работать на текущих ценовых условиях в период extended access. Это гарантирует, что клиенты, которые договорились о специальных условиях с провайдерами моделей или инвестировали в provisioned capacity, не будут неожиданно затронуты изменениями цен.

Процесс уведомлений об изменениях состояния модели

Клиенты получат уведомление за 6 месяцев до даты EOL модели, когда провайдер переводит модель в состояние Legacy. Такой проактивный подход к коммуникации дает клиентам достаточно времени, чтобы спланировать и выполнить стратегию миграции до того, как модель станет EOL.

Уведомления содержат сведения о модели, выводимой из эксплуатации, важные даты, доступность extended access и дату EOL. AWS использует несколько каналов, чтобы эти важные сообщения доходили до нужных людей, в том числе:

  • Уведомления по электронной почте
  • AWS Health Dashboard
  • Оповещения в консоли Amazon Bedrock
  • Программный доступ через API.

Чтобы гарантированно получать эти уведомления, проверьте и настройте адреса электронной почты контактных лиц аккаунта. По умолчанию уведомления отправляются на email root-пользователя аккаунта и на альтернативные контакты (operations, security и billing). Вы можете просмотреть и обновить эти контакты на странице AWS Account в разделе Alternate contacts. Чтобы добавить дополнительных получателей или каналы доставки, например Slack или списки рассылки по email, откройте AWS User Notifications console и выберите AWS managed notifications subscriptions для управления каналами доставки и контактами аккаунта. Если вы не получаете ожидаемые уведомления, проверьте, правильно ли настроены адреса электронной почты, и убедитесь, что письма-уведомления от health@aws.com не фильтруются вашим почтовым провайдером.

Стратегии миграции и лучшие практики

При переходе на более новую модель обновите код приложения и убедитесь, что ваши service quotas выдержат ожидаемую нагрузку. Заблаговременное планирование помогает перейти плавно и с минимальными сбоями.

Планирование сроков миграции

Начинайте планирование сразу после того, как модель переходит в состояние Legacy:

  • Фаза оценки — Оцените текущее использование legacy-модели, включая приложения, которые от нее зависят, типичные шаблоны запросов и конкретные поведенческие особенности или ответы, на которые опираются ваши приложения.
  • Исследовательская фаза — Изучите рекомендуемую заменяющую модель, ее возможности, отличия от legacy-модели, новые функции, которые могут улучшить ваши приложения, и Regional availability новой модели. Изучите изменения API и документацию.
  • Фаза тестирования — Проведите тщательное тестирование новой модели и сравните метрики производительности между моделями. Это поможет определить, какие корректировки нужны в коде приложения или в prompt engineering.
  • Фаза миграции — Внедряйте изменения поэтапно. Отслеживайте производительность системы во время перехода и сохраняйте возможность отката.
  • Операционная фаза — После миграции постоянно отслеживайте приложения и отзывы пользователей, чтобы убедиться, что они работают ожидаемым образом с новой моделью.

Технические шаги миграции

Тщательно протестируйте миграцию:

  • Обновите ссылки на API — Измените код приложения, чтобы он ссылался на новый идентификатор модели. Например, замените anthropic.claude-3-5-sonnet-20240620-v1:0 на anthropic.claude-sonnet-4-5-20250929-v1:0 или на global cross-Region inference global.anthropic.claude-sonnet-4-5-20250929-v1:0. Обновите структуру prompt в соответствии с best practices новой модели. Более подробные рекомендации см. в статье Migrate from Anthropic’s Claude Sonnet 3.x to Claude Sonnet 4.x on Amazon Bedrock.
  • Запросите увеличение квот — Перед полным переходом убедитесь, что квот для новой модели достаточно, при необходимости запросив увеличение через консоль AWS Service Quotas.
  • Адаптируйте prompt — Новые модели могут иначе отвечать на те же запросы. Пересмотрите и уточните prompt в соответствии с характеристиками новой модели. Также можно использовать такие инструменты, как prompt optimizer в Amazon Bedrock, чтобы помочь переписать prompt для целевой модели.
  • Обновите обработку ответов — Если новая модель возвращает ответы в другом формате или с другими характеристиками, обновите логику парсинга и обработки соответствующим образом.
  • Оптимизируйте использование токенов — Используйте улучшения эффективности в новых моделях, пересмотрев и оптимизировав шаблоны использования токенов. Например, модели с поддержкой prompt caching могут снизить стоимость и задержку ваших вызовов.

Стратегии тестирования

Тщательное тестирование критично для успешной миграции:

  • Сравнение side-by-side — Выполняйте одинаковые запросы к legacy- и новой модели, чтобы сравнить ответы и выявить различия, которые могут повлиять на приложение. В production-среде рассмотрите shadow testing — отправку дублирующих запросов новой модели параллельно с существующей без влияния на конечных пользователей. Такой подход позволяет оценить производительность модели, задержки и частоту ошибок, а также другие операционные факторы до полной миграции. Проводите A/B testing для оценки влияния на пользователей, направляя контролируемую долю живого трафика на новую модель и отслеживая ключевые метрики, такие как вовлеченность, доля выполненных задач, оценки удовлетворенности и бизнес-KPI.
  • Тестирование производительности — Измеряйте время отклика, использование токенов и другие метрики производительности, чтобы понять, как новая модель работает по сравнению с legacy-версией. Проверяйте бизнес-специфические метрики успеха.
  • Регрессионное тестирование и тестирование edge cases — Убедитесь, что существующая функциональность продолжает работать как ожидается с новой моделью. Особое внимание уделите необычным или сложным входным данным, которые могут выявить различия в обработке трудных сценариев.

Заключение

Политика жизненного цикла моделей в Amazon Bedrock задает понятные этапы управления эволюцией FM. Периоды перехода предоставляют варианты extended access, а механизмы для fine-tuned моделей помогают балансировать между инновациями и стабильностью.

Следите за состояниями моделей через AWS Health Dashboard, планируйте миграцию, когда модели переходят в состояние Legacy, и тщательно тестируйте новые версии. Эти рекомендации помогут сохранять непрерывность работы AI-приложений, используя при этом улучшенные возможности новых моделей.

Если у вас есть дополнительные вопросы или опасения, обратитесь к вашей команде AWS. Мы хотим помочь вам и обеспечить плавный переход, пока вы продолжаете использовать последние достижения в области FM-технологий.

Для дальнейшего изучения и поддержки внедрения ознакомьтесь с официальной документацией AWS Bedrock с подробными руководствами и API reference. Также посетите AWS Machine Learning Blog и AWS Architecture Center, где есть практические кейсы, best practices миграции и reference architectures, которые помогут оптимизировать стратегию управления жизненным циклом моделей.


Материал — перевод статьи с английского.

Оригинал: Understanding Amazon Bedrock model lifecycle