Модель Fundamental NEXUS для табличных данных доступна в Amazon SageMaker JumpStart
Сегодня Amazon объявляет о поддержке модели NEXUS от Fundamental в Amazon SageMaker AI. С этим запуском вы можете развернуть foundation model (FM), специально созданную для прогнозирования по табличным данным. Модель помогает бизнесу получать точные, детерминированные прогнозы на основе структурированных данных за дни, а не за месяцы.
В этой публикации показано, как начать работу с NEXUS в Amazon SageMaker JumpStart, пройти процесс развертывания и запускать прогнозы на ваших корпоративных наборах данных.
Что такое NEXUS?
NEXUS — это foundation model, разработанная Fundamental и предназначенная для прогнозирования по табличным данным. Большие языковые модели (LLM) созданы для текста, а традиционные подходы машинного обучения (ML) требуют обширной инженерии признаков и обучения модели. NEXUS работает иначе. Она предварительно обучена на миллиардах реальных задач прогнозирования на структурированных наборах данных, поэтому уже умеет находить сигнал в ваших данных.
Как Large Tabular Model, NEXUS создана для анализа структурированных данных и предлагает несколько ключевых нововведений:
- Детерминированная архитектура — вероятностные LLM могут давать разные ответы на одинаковые запросы. NEXUS выдает последовательные, воспроизводимые результаты для каждого отдельного прогноза.
- Нативное понимание таблиц — обученная на миллиардах таблиц, NEXUS нативно обрабатывает числа, категории, даты и неструктурированный текст без ручной инженерии признаков.
- Непоследовательное рассуждение — большинство моделей ИИ предсказывают последовательные данные, например следующее слово или следующий пиксель. NEXUS анализирует многомерные связи в корпоративных таблицах. Например, при прогнозировании оттока клиентов NEXUS понимает, как несколько факторов — частота транзакций, обращения в поддержку и экономические индикаторы — влияют на вероятность ухода.
Почему существующие подходы не справляются
Самые ценные корпоративные данные хранятся в таблицах: в электронных таблицах, системах планирования ресурсов предприятия (ERP), системах управления взаимоотношениями с клиентами (CRM) и реляционных базах данных. Многие критически важные бизнес-решения зависят от прогнозов по этим данным. Однако у существующих инструментов есть существенные ограничения:
- Традиционный ML требует от команд data science 3–6 месяцев, чтобы построить, обучить и развернуть модель для одного сценария использования. Приходится постоянно выбирать между качеством и количеством прогнозов.
- LLM недетерминированы: на одном и том же наборе данных они могут давать разные ответы. Кроме того, при токенизации они теряют числовой контекст, что приводит к неточным результатам на структурированных данных и требует сложных защитных механизмов.
NEXUS архитектурно ориентирована на табличные данные и дает такие преимущества:
- Инвариантность к перестановке столбцов — понимает, что изменение порядка столбцов не меняет смысл, в отличие от того, как transformer обрабатывают данные.
- Возможность работы с миллиардами строк — обрабатывает огромные наборы данных без усечения и выборки.
- Рассуждение по разным схемам — автоматически связывает связанные данные из разрозненных таблиц.
- Автономная очистка данных — исправляет неполные записи; например, NEXUS может делать прогнозы даже при отсутствии части значений.
Как NEXUS работает в Amazon SageMaker AI
На следующем рисунке показан полный поток развертывания и выполнения прогнозов с NEXUS в SageMaker AI.

NEXUS работает на выделенном одноарендном GPU-экземпляре с сетевой изоляцией внутри управляемой среды SageMaker AI. Рабочий процесс состоит из следующих шагов:
- Подписка и развертывание — подпишитесь на пакет модели NEXUS в AWS Marketplace, затем разверните его как управляемый inference endpoint SageMaker AI на экземпляре
ml.p5en.48xlarge(8× NVIDIA H200 GPU). - Установка SDK — установите Fundamental Python SDK и подключите его к endpoint в SageMaker. SDK предоставляет привычный API, совместимый со scikit-learn, с оценщиками
NEXUSClassifierиNEXUSRegressor. - Загрузка данных в Amazon S3 — SDK сериализует ваши табличные данные и загружает их в бакет Amazon Simple Storage Service (Amazon S3) в вашем аккаунте.
- Обучение модели — вызовите
clf.fit(X_train, y_train)для обучения. NEXUS автоматически выполняет очистку данных и инженерные преобразования признаков, без необходимости ручного конвейера. - Получение прогнозов — вызовите
clf.predict(X_test)для детерминированных прогнозов илиclf.predict_proba(X_test)для оценки вероятностей. Результаты сохраняются обратно в ваш бакет Amazon S3.
Ваши данные остаются в среде AWS на протяжении всего процесса. Endpoint изолирован от сети и является одноарендным, что делает NEXUS подходящей для корпоративных нагрузок с чувствительными данными.
Как начать работу с NEXUS в Amazon SageMaker AI
Чтобы начать, откройте Amazon SageMaker JumpStart, найдите Fundamental NEXUS и выберите один из вариантов:
- Базовая модель (предварительно обучена на более чем 10 млрд табличных строк).
- Отраслевые варианты для финансов, здравоохранения и производства.


Корпоративные сценарии использования, меняющие отрасли
Табличные данные — основа корпоративного принятия решений: от финансовых журналов до медицинских записей и логов цепочек поставок. NEXUS специально создана для таких данных и помогает перейти от «сырых» структурированных данных к прогнозам уровня production без большой инженерии признаков и длительного обучения модели. Ниже приведены несколько типовых сценариев, где NEXUS может создавать ценность.
Финансовые услуги
- Обнаружение мошенничества — анализирует паттерны транзакций по миллионам счетов.
- Моделирование кредитного риска — обрабатывает кредитные портфели с автоматическим извлечением признаков.
- Регуляторное соответствие — извлекает структурированные данные из неструктурированных регуляторных отчетов.
Здравоохранение
- Подбор для клинических исследований — находит подходящих пациентов в системах электронных медицинских карт (EHR).
- Разработка лекарств — анализирует данные биологических анализов для скрининга соединений.
- Стратификация риска пациентов — прогнозирует риски повторной госпитализации на основе временных рядов из отделений интенсивной терапии (ICU).
Производство и цепочки поставок
- Предиктивное обслуживание — прогнозирует отказы оборудования по данным датчиков.
- Прогнозирование спроса — оценивает потребности в запасах по глобальным сетям дистрибуции.
- Анализ рисков поставщиков — оценивает надежность подрядчиков на основе истории закупок.
Розница и ecommerce
- Прогноз оттока — выявляет клиентов с риском ухода по истории покупок и поведению при просмотре.
- Динамическое ценообразование — оптимизирует цены на основе данных о конкурентах и уровня запасов.
- Анализ отказа от корзины — помогает понять, почему покупатели оставляют товары в онлайн-корзине.
Почему стоит выбрать NEXUS в Amazon SageMaker AI
Развернуть модель — только половина задачи. Инфраструктура, на которой она работает, определяет, как быстро вы сможете перейти от экспериментов к production. SageMaker AI предоставляет управляемую, защищенную и масштабируемую среду для запуска NEXUS на корпоративном уровне. Вместе NEXUS и AWS сокращают непрофильную сложную работу, чтобы data scientists могли сосредоточиться на бизнес-результатах, а не на управлении инфраструктурой.
- Ускоренная отдача от внедрения — готовые контейнеры и скрипты сокращают время развертывания.
- Экономическая эффективность — управляемая инфраструктура SageMaker AI снижает операционные накладные расходы.
- Масштабируемость — автоматически масштабируется до наборов данных размером в петабайты.
- Готовность к комплаенсу — по умолчанию соответствует требованиям GDPR, HIPAA и SOC 2.
- Непрерывное обучение — нативная интеграция с Amazon SageMaker Pipelines для переобучения модели.
- Поддержка multiplex — позволяет выполнять несколько операций fit и predict на одном endpoint SageMaker AI, убирая необходимость выделять отдельные ресурсы под каждый сценарий.
Стратегическое партнерство AWS
Fundamental заключила стратегическое партнерство с AWS, чтобы ускорить внедрение в enterprise-сегменте:
- Нативная интеграция — развертывание NEXUS напрямую из AWS Marketplace.
- Защищенная инфраструктура — работа в безопасной, соответствующей требованиям облачной среде AWS.
- Поддержка для enterprise — выделенные AWS Solutions Architects для помощи во внедрении.
Следующие шаги
Готовы преобразовать решения, основанные на данных?
- Свяжитесь с командой Fundamental, чтобы узнать больше.
- Попробуйте управляемый пример notebook в пространстве JupyterLab на Amazon SageMaker AI.
Вывод
В этой публикации показано, как поддержка модели NEXUS в Amazon SageMaker AI помогает извлекать новые инсайты из структурированных данных. Независимо от того, прогнозируете ли вы отказы оборудования, оптимизируете цепочки поставок или выявляете финансовое мошенничество, NEXUS предоставляет детерминированные и масштабируемые возможности для корпоративных задач прогнозирования.
Чтобы узнать больше, см. следующие ресурсы:
Документация Fundamental NEXUS
Руководство Amazon SageMaker AI Developer Guide
Материал — перевод статьи с английского.
Оригинал: Fundamental’s Large Tabular Model NEXUS is now available on Amazon SageMaker JumpStart