Модель Fundamental NEXUS для табличных данных доступна в Amazon SageMaker JumpStart — ИИ для бизнеса

Модель Fundamental NEXUS для табличных данных доступна в Amazon SageMaker JumpStart

Прослушать статью

Сегодня Amazon объявляет о поддержке модели NEXUS от Fundamental в Amazon SageMaker AI. С этим запуском вы можете развернуть foundation model (FM), специально созданную для прогнозирования по табличным данным. Модель помогает бизнесу получать точные, детерминированные прогнозы на основе структурированных данных за дни, а не за месяцы.

В этой публикации показано, как начать работу с NEXUS в Amazon SageMaker JumpStart, пройти процесс развертывания и запускать прогнозы на ваших корпоративных наборах данных.

Что такое NEXUS?

NEXUS — это foundation model, разработанная Fundamental и предназначенная для прогнозирования по табличным данным. Большие языковые модели (LLM) созданы для текста, а традиционные подходы машинного обучения (ML) требуют обширной инженерии признаков и обучения модели. NEXUS работает иначе. Она предварительно обучена на миллиардах реальных задач прогнозирования на структурированных наборах данных, поэтому уже умеет находить сигнал в ваших данных.

Как Large Tabular Model, NEXUS создана для анализа структурированных данных и предлагает несколько ключевых нововведений:

  • Детерминированная архитектура — вероятностные LLM могут давать разные ответы на одинаковые запросы. NEXUS выдает последовательные, воспроизводимые результаты для каждого отдельного прогноза.
  • Нативное понимание таблиц — обученная на миллиардах таблиц, NEXUS нативно обрабатывает числа, категории, даты и неструктурированный текст без ручной инженерии признаков.
  • Непоследовательное рассуждение — большинство моделей ИИ предсказывают последовательные данные, например следующее слово или следующий пиксель. NEXUS анализирует многомерные связи в корпоративных таблицах. Например, при прогнозировании оттока клиентов NEXUS понимает, как несколько факторов — частота транзакций, обращения в поддержку и экономические индикаторы — влияют на вероятность ухода.

Почему существующие подходы не справляются

Самые ценные корпоративные данные хранятся в таблицах: в электронных таблицах, системах планирования ресурсов предприятия (ERP), системах управления взаимоотношениями с клиентами (CRM) и реляционных базах данных. Многие критически важные бизнес-решения зависят от прогнозов по этим данным. Однако у существующих инструментов есть существенные ограничения:

  • Традиционный ML требует от команд data science 3–6 месяцев, чтобы построить, обучить и развернуть модель для одного сценария использования. Приходится постоянно выбирать между качеством и количеством прогнозов.
  • LLM недетерминированы: на одном и том же наборе данных они могут давать разные ответы. Кроме того, при токенизации они теряют числовой контекст, что приводит к неточным результатам на структурированных данных и требует сложных защитных механизмов.

NEXUS архитектурно ориентирована на табличные данные и дает такие преимущества:

  • Инвариантность к перестановке столбцов — понимает, что изменение порядка столбцов не меняет смысл, в отличие от того, как transformer обрабатывают данные.
  • Возможность работы с миллиардами строк — обрабатывает огромные наборы данных без усечения и выборки.
  • Рассуждение по разным схемам — автоматически связывает связанные данные из разрозненных таблиц.
  • Автономная очистка данных — исправляет неполные записи; например, NEXUS может делать прогнозы даже при отсутствии части значений.

Как NEXUS работает в Amazon SageMaker AI

На следующем рисунке показан полный поток развертывания и выполнения прогнозов с NEXUS в SageMaker AI.

Схема сквозной архитектуры, показывающая поток развертывания NEXUS в Amazon SageMaker AI, включая подписку в AWS Marketplace, развертывание endpoint, подключение SDK, загрузку данных в Amazon S3 и вывод прогнозов.

NEXUS работает на выделенном одноарендном GPU-экземпляре с сетевой изоляцией внутри управляемой среды SageMaker AI. Рабочий процесс состоит из следующих шагов:

  1. Подписка и развертывание — подпишитесь на пакет модели NEXUS в AWS Marketplace, затем разверните его как управляемый inference endpoint SageMaker AI на экземпляре ml.p5en.48xlarge (8× NVIDIA H200 GPU).
  2. Установка SDK — установите Fundamental Python SDK и подключите его к endpoint в SageMaker. SDK предоставляет привычный API, совместимый со scikit-learn, с оценщиками NEXUSClassifier и NEXUSRegressor.
  3. Загрузка данных в Amazon S3 — SDK сериализует ваши табличные данные и загружает их в бакет Amazon Simple Storage Service (Amazon S3) в вашем аккаунте.
  4. Обучение модели — вызовите clf.fit(X_train, y_train) для обучения. NEXUS автоматически выполняет очистку данных и инженерные преобразования признаков, без необходимости ручного конвейера.
  5. Получение прогнозов — вызовите clf.predict(X_test) для детерминированных прогнозов или clf.predict_proba(X_test) для оценки вероятностей. Результаты сохраняются обратно в ваш бакет Amazon S3.

Ваши данные остаются в среде AWS на протяжении всего процесса. Endpoint изолирован от сети и является одноарендным, что делает NEXUS подходящей для корпоративных нагрузок с чувствительными данными.

Как начать работу с NEXUS в Amazon SageMaker AI

Чтобы начать, откройте Amazon SageMaker JumpStart, найдите Fundamental NEXUS и выберите один из вариантов:

  • Базовая модель (предварительно обучена на более чем 10 млрд табличных строк).
  • Отраслевые варианты для финансов, здравоохранения и производства.
Страница результатов поиска Amazon SageMaker JumpStart с карточкой модели Fundamental NEXUS.
Страница с деталями модели Amazon SageMaker JumpStart для Fundamental NEXUS, показывающая описание модели и варианты развертывания.

Корпоративные сценарии использования, меняющие отрасли

Табличные данные — основа корпоративного принятия решений: от финансовых журналов до медицинских записей и логов цепочек поставок. NEXUS специально создана для таких данных и помогает перейти от «сырых» структурированных данных к прогнозам уровня production без большой инженерии признаков и длительного обучения модели. Ниже приведены несколько типовых сценариев, где NEXUS может создавать ценность.

Финансовые услуги

  • Обнаружение мошенничества — анализирует паттерны транзакций по миллионам счетов.
  • Моделирование кредитного риска — обрабатывает кредитные портфели с автоматическим извлечением признаков.
  • Регуляторное соответствие — извлекает структурированные данные из неструктурированных регуляторных отчетов.

Здравоохранение

  • Подбор для клинических исследований — находит подходящих пациентов в системах электронных медицинских карт (EHR).
  • Разработка лекарств — анализирует данные биологических анализов для скрининга соединений.
  • Стратификация риска пациентов — прогнозирует риски повторной госпитализации на основе временных рядов из отделений интенсивной терапии (ICU).

Производство и цепочки поставок

  • Предиктивное обслуживание — прогнозирует отказы оборудования по данным датчиков.
  • Прогнозирование спроса — оценивает потребности в запасах по глобальным сетям дистрибуции.
  • Анализ рисков поставщиков — оценивает надежность подрядчиков на основе истории закупок.

Розница и ecommerce

  • Прогноз оттока — выявляет клиентов с риском ухода по истории покупок и поведению при просмотре.
  • Динамическое ценообразование — оптимизирует цены на основе данных о конкурентах и уровня запасов.
  • Анализ отказа от корзины — помогает понять, почему покупатели оставляют товары в онлайн-корзине.

Почему стоит выбрать NEXUS в Amazon SageMaker AI

Развернуть модель — только половина задачи. Инфраструктура, на которой она работает, определяет, как быстро вы сможете перейти от экспериментов к production. SageMaker AI предоставляет управляемую, защищенную и масштабируемую среду для запуска NEXUS на корпоративном уровне. Вместе NEXUS и AWS сокращают непрофильную сложную работу, чтобы data scientists могли сосредоточиться на бизнес-результатах, а не на управлении инфраструктурой.

  • Ускоренная отдача от внедрения — готовые контейнеры и скрипты сокращают время развертывания.
  • Экономическая эффективность — управляемая инфраструктура SageMaker AI снижает операционные накладные расходы.
  • Масштабируемость — автоматически масштабируется до наборов данных размером в петабайты.
  • Готовность к комплаенсу — по умолчанию соответствует требованиям GDPR, HIPAA и SOC 2.
  • Непрерывное обучение — нативная интеграция с Amazon SageMaker Pipelines для переобучения модели.
  • Поддержка multiplex — позволяет выполнять несколько операций fit и predict на одном endpoint SageMaker AI, убирая необходимость выделять отдельные ресурсы под каждый сценарий.

Стратегическое партнерство AWS

Fundamental заключила стратегическое партнерство с AWS, чтобы ускорить внедрение в enterprise-сегменте:

  • Нативная интеграция — развертывание NEXUS напрямую из AWS Marketplace.
  • Защищенная инфраструктура — работа в безопасной, соответствующей требованиям облачной среде AWS.
  • Поддержка для enterprise — выделенные AWS Solutions Architects для помощи во внедрении.

Следующие шаги

Готовы преобразовать решения, основанные на данных?

Вывод

В этой публикации показано, как поддержка модели NEXUS в Amazon SageMaker AI помогает извлекать новые инсайты из структурированных данных. Независимо от того, прогнозируете ли вы отказы оборудования, оптимизируете цепочки поставок или выявляете финансовое мошенничество, NEXUS предоставляет детерминированные и масштабируемые возможности для корпоративных задач прогнозирования.

Чтобы узнать больше, см. следующие ресурсы:

Документация Fundamental NEXUS

Руководство Amazon SageMaker AI Developer Guide


Материал — перевод статьи с английского.

Оригинал: Fundamental’s Large Tabular Model NEXUS is now available on Amazon SageMaker JumpStart