Amazon Quick: ускорение пути от корпоративных данных к решениям на базе ИИ

Прослушать статью

Корпоративные данные с десятками миллионов строк, почтительным уровнем безопасности на уровне строк и столбцов и десятками наборов данных, охватывающих разные бизнес-домены, требуют ответов, сгенерированных ИИ, которые были бы надежными, воспроизводимыми и быстрыми, при этом последовательно соблюдали правила управления данными. С помощью foundation models (FMs) организации могут строить системы, хорошо работающие на небольших наборах данных, где бизнес-пользователь задает вопрос о своих данных и получает ответ за секунды. Amazon Quick тоже помогает превращать большие корпоративные данные в быстрые и точные решения на базе ИИ. В этом материале рассматриваются пять новых возможностей Amazon Quick, которые ускоряют доставку доверенных ИИ-аналитических выводов в масштабе предприятия.

Dataset Q&A: задавайте вопросы данным напрямую

Когда вице-президент спрашивает: «Как меняется churn по этому продукту?», получить ответ означает либо найти нужный дашборд, если он вообще существует именно для такого среза, либо ждать, пока аналитик напишет запрос и проверит результат. Разрыв между моментом появления вопроса и получением достоверного ответа измеряется часами или днями, и он растет вместе со сложностью организации. Это означает больше команд, больше наборов данных и больше вопросов, для которых никто заранее не подготовил представление.

Dataset Q&A сокращает этот разрыв. Вы подключаете один или несколько наборов данных к чат-агенту или к Quick Space с разнородными активами и задаете вопрос на естественном языке. Система генерирует SQL и выполняет его по всему набору данных, без выборки, на миллионах строк, чтобы вернуть результат за секунды.

Сгенерировать SQL по вопросу — самая простая часть. Гораздо сложнее все, что влияет на то, как именно этот SQL будет написан. Если аналитик отвечает вице-президенту значением 2,3 процента, неявное соглашение состоит в том, что он понимает расчеты, фильтры, временной горизонт и любой другой связанный контекст, необходимый для ответа на запрос. Доверие к ответу основано на том, что он пришел от аналитика. Система также снимает неоднозначность самого вопроса: означает ли «growth» транзакции, клиентов, выручку или единицы? Она определяет правильные поля, агрегации и фильтры, а затем применяет бизнес-определения, которые аналитики передали через метаданные набора данных. В результате получается SQL, который стремится отражать реальные семантические правила вашей предметной области, а не приблизительную интерпретацию имен столбцов.

Amazon Quick применяет политики доступа на уровне строк и столбцов, настроенные для наборов данных и дашбордов, к сгенерированным ИИ запросам, привязывая их к вашей учетной записи. Благодаря этому тот уровень безопасности, который вы уже выстроили, автоматически распространяется на ответы в диалоге без дополнительной настройки. В результате вы переходите от вопроса к проверенному ответу без обращения к бизнес-аналитикам, без ожидания обновления дашборда и без предварительных настроек.

Пояснения: проверка логики

Скорость необходима, но недостаточна. Когда в ответе важна вычислительная точность, а в enterprise-аналитике это обычно так, нужно видеть, как был получен результат. Chat explanations показывают полную цепочку рассуждений: вызванные инструменты, сгенерированный SQL, примененные фильтры, сделанные допущения и краткое объяснение на понятном языке для нетехнических стейкхолдеров. Для инженеров Business Intelligence и дата-аналитиков это ускоритель разработки. Вы задаете контрольные вопросы, изучаете ход рассуждений, добавляете дополнительный контекст и настраиваете guardrails. После того как вы уверены, что агент корректно работает в вашей предметной области, вы передаете его стейкхолдерам. То, что раньше занимало недели итеративного тестирования, теперь сводится к сфокусированным сессиям.

Подробнее можно узнать в публикации о запуске Dataset Q&A. Также можно посмотреть, как программа AWS Technical Field Communities использовала Dataset Q&A, чтобы повысить точность запросов более чем на 48 процентов и сократить время решения с 90 минут до менее чем 5 минут для более чем 15 000 участников, в блоге Beyond BI: How the Dataset Q&A feature of Amazon Quick powers the next generation of data decisions.

Семантическое обогащение: обучаем ИИ языку вашего бизнеса

Точность Dataset Q&A во многом зависит от того, насколько хорошо система понимает ваш бизнес-словарь. Столбец с названием revenue не сообщает ИИ, это валовая или чистая выручка, до возвратов или после них, по методу начисления или по кассовому методу. Столбец active_customers не раскрывает, порог установлен на 12 или 24 месяца. Это не проблема интеллекта модели, а проблема информации. Без бизнес-контекста даже лучшая модель строит запросы на основе допущений.

Dataset Enrichment дает авторам способ закрыть этот пробел без настройки topic configuration или других сложных процедур. На уровне набора данных вы задаете текстовое описание того, что представляет собой информация, и свободные инструкции, которые подсказывают ИИ, как рассуждать о ней. Например: «выручка здесь чистая, после возвратов; для year-over-year используйте fiscal_year, а не calendar_year». При желании можно загрузить файл метаданных из используемой вами системы-источника, например из существующего data catalog или из wiki команды. На уровне столбцов можно группировать поля в логические папки, добавлять описания и помечать пограничные случаи.

Вложение занимает минуты. А выгода в том, что когда кто-то задает вопрос ниже по цепочке, Quick применяет определения, которые ваша команда уже согласовала. Подробнее см. Dataset Enrichment в руководстве пользователя Amazon Quick.

Как Quick находит правильный источник — и правильный подход — для каждого вопроса

Обогащение одного набора данных — лишь часть задачи. В типичной компании у вас может быть доступ к десяткам наборов данных и дашбордов в продажах, операциях, финансах, HR и исследованиях рынка. Чтобы ответить на вопрос, заданный на естественном языке, система должна выбрать правильные данные и наиболее подходящего агента для задачи. Ошибка в любом из этих выборов приводит к нерелевантному или неверному ответу даже у самой способной модели.

Для многошаговых вопросов вроде «Как меняется churn, и что на него влияет в регионе Southeast?» система определяет, каких специализированных агентов и инструментов вызывать на каждом шаге. Orchestrator анализирует весь вопрос, планирует последовательность действий и собирает связный ответ из нескольких возможностей, работающих вместе.

Мы улучшили то, как этот уровень находит, ранжирует и выбирает и правильный источник, и правильный инструмент. Это особенно полезно в средах, где доступно большое разнообразие данных по нескольким бизнес-доменам. Более точная привязка к данным означает меньше ошибок из-за неверного источника, более точный выбор инструмента и более высокую уверенность в ответах, особенно для неоднозначных или сложных вопросов, которые требуют нескольких аналитических шагов. Именно этот слой обнаружения и оркестрации делает более широкий agentic experience надежным в масштабе предприятия.

Генерация дашбордов с помощью ИИ: от дней к минутам

Операционные дашборды занимают особое место в принятии корпоративных решений, и conversational tools их не заменяют. Хорошо построенный дашборд объединяет leading и lagging indicators, метрики, организованные по функциям и временному горизонту, а также фильтры, позволяющие срезать контекст на общей поверхности. Такая плотность дает команде принимающих решения с разными ролями и вопросами общую и эффективную аналитическую среду, которая ускоряет согласование действий. Для сложного бизнеса этот общий артефакт делает сумму частей больше, чем отдельные элементы. Conversational analysis tools, такие как чат, — отличный дополнительный механизм, который стейкхолдеры могут использовать для дальнейшего изучения сложных follow-up вопросов без лишней нагрузки на аналитиков или инженеров. Но дашборды по-прежнему остаются основой операционного ритма.

Создание дашборда включает выбор правильных визуализаций, логичную организацию листов, создание вычисляемых полей, добавление фильтров и итерации по компоновке. Эти задачи требуют дней или недель квалифицированной ручной работы. Большая часть работы становится механической, как только аналитическая цель понятна. Когда автор знает, чего хочет, узкое место — это сборка, а не мышление. Генерация дашбордов с помощью ИИ убирает эту стадию сборки. Вы выбираете до трех наборов данных и описываете, что хотите видеть, например бизнес-вопросы, метрики и способ организации информации. Перед тем как что-то будет создано, вы просматриваете редактируемый план. Затем Amazon Quick создает несколько структурированных листов с визуализациями, подобранными к данным, фильтрами для среза по разным измерениям и вычисляемыми полями вроде роста year-over-year и сравнений month-over-month. Вся процедура занимает всего несколько минут.

Результат — это нативный анализ Amazon Quick, а не статичное изображение или одноразовый экспорт. Он встраивается в существующие процессы публикации, паттерны embedding и пайплайны continuous integration and delivery (CI/CD). Его также можно редактировать с помощью point-and-click controls. После генерации можно дорабатывать визуализации. Вы публикуете его как дашборд, делитесь им, встраиваете его или настраиваете отчеты, как если бы он был собран вручную. Семантическая работа, вложенная в dataset enrichment, влияет на качество результата. При лучшем бизнес-контексте начальный результат точнее, а значит, требуется меньше доработок перед публикацией.

В период early access авторы сообщали о сокращении времени создания дашбордов на 90 процентов и более. Подробнее о функции и примерах можно прочитать в публикации Generate dashboards from natural language prompts in Amazon Quick.

Доступ к данным в реальном времени: Direct Query для Amazon Simple Storage Service (Amazon S3) Tables

Описанные выше возможности — запросы, пояснения, семантическое обогащение, обнаружение источника и генерация дашбордов — настолько хороши, насколько хороши данные, на которых они работают. Предприятия все чаще строят свои data estates на открытых форматах таблиц, таких как Apache Iceberg, из-за производительности, экономичности и гибкости, которые они дают. Но сохранялся устойчивый разрыв. Чтобы анализировать такие данные в Business Intelligence tool или задавать о них вопросы через ИИ-агента, данные приходилось переносить в OLAP-слой. Каждый переход добавляет задержку, стоимость и еще одно место, где может ухудшиться актуальность.

Мы убрали этот переход. Теперь Amazon Quick может напрямую подключаться к таблицам Apache Iceberg, расположенным в S3 Table buckets, без промежуточного движка. Озеро данных становится аналитически готовым источником.

Авторы могут выбирать между режимом SPICE mode для высококонкурентных, работающих меньше секунды дашбордов и режимом Direct Query mode для сценариев, где важнее всего свежесть данных. В режиме Direct Query и традиционные дашборды, и conversational AI agents читают одни и те же живые данные. Вы можете увидеть транзакцию в графике, метрике или ответе чата через мгновения после того, как она попадет в S3 Table bucket по streaming pipeline.

Для организаций, переходящих к современным lake-first architectures, это заметное упрощение: один управляемый слой данных обслуживает и людей, и ИИ-потребителей, без репликации и оркестрации между ними. Подробнее и с примером реализации см. публикацию From data lake to AI-ready analytics: Introducing new data source with S3 Tables in Amazon Quick.

Создано для людей, которые строят аналитику

Эти возможности убирают рутину из аналитического процесса, не убирая людей, которые привносят здравый смысл, управление и предметную экспертизу. Бизнес-аналитик по-прежнему решает, как считать churn. Data engineer по-прежнему управляет тем, кто к чему имеет доступ. Бизнес-аналитик по-прежнему курирует опыт для своих стейкхолдеров. Архитектуры корпоративных данных сложны и разнообразны. Мы понимаем, что ни один предписывающий workflow не является универсальным. То, что мы строим, — это богатый набор инструментов и возможностей, каждая из которых ценна сама по себе, построенных на общих принципах управления в малообслуживаемом managed service и вместе ускоряющих то, как предприятия применяют ИИ в своей data landscape. Меняется объем усилий, необходимых, чтобы превратить экспертизу в работающую и доверенную аналитику в масштабе. Там, где раньше на создание дашборда уходили дни, теперь нужны минуты. Там, где проверка ответа ИИ требовала ручного повторного запуска запросов, теперь достаточно выбрать опцию. Там, где внесение бизнес-контекста означало осознанную настройку topic configuration, теперь достаточно загрузить файл.

Эти возможности доступны уже сегодня во всех регионах AWS, где доступен Amazon Quick.

Материал — перевод статьи с английского.

Оригинал: Amazon Quick: Accelerating the path from enterprise data to AI-powered decisions

Подписаться на новости в Telegram