Google представила Agentic Data Cloud для превращения данных в контекст для AI-агентов

Прослушать статью

Google противостоит AWS и Microsoft в формирующейся гонке AI-стека данных

Google перестраивает свой портфель данных и аналитики в архитектуру Agentic Data Cloud. По словам компании, она должна помочь перевести корпоративный AI из стадии пилота в промышленную эксплуатацию за счет превращения разрозненных данных в единую семантическую прослойку, по которой агенты смогут надежнее рассуждать и действовать в масштабе.

Новая архитектура опирается на существующую стратегию платформы данных Google и объединяет такие сервисы, как BigQuery, Dataplex и Vertex AI, повышая их возможности в области метаданных, governance и межоблачной совместимости до уровня, который компания называет общей прослойкой intelligence.

Основой этой стратегии является новый Knowledge Catalog — развитие Dataplex Universal Catalog. Компания заявила, что новые возможности расширяют ее фундамент метаданных до семантического слоя, который отображает бизнес-смысл и связи между источниками данных.

Среди этих возможностей — нативная поддержка сторонних каталогов, приложений вроде Salesforce, Palantir, Workday, SAP и ServiceNow, а также возможность переносить сторонние данные в lakehouse Google, где они автоматически сопоставляются с Knowledge Catalog.

Чтобы точнее отражать бизнес-логику для данных, хранящихся внутри Google Cloud, компания добавляет инструменты, включая агента на основе LookML, который сейчас доступен в preview и может извлекать семантику из документации, а также новую функцию в BigQuery, тоже в preview, которая позволяет предприятиям встраивать эту бизнес-логику для ускорения анализа данных.

Кроме простой агрегации, сам каталог должен постоянно обогащать семантический контекст, анализируя, как данные используются по всей компании, написали старшие руководители Google в блоге.

Это включает профилирование структурированных наборов данных, а также теги и аннотации для неструктурированного контента, хранящегося в Google Cloud Storage, отметили руководители. Они добавили, что базовая система каталога также может выводить недостающую структуру в данных, используя модели Gemini для генерации схем и определения связей.

Превращение данных в бизнес-контекст становится новой линией фронта в AI

Для аналитиков акцент Google на семантике нацелен на один из главных барьеров для production AI в enterprise-сегменте.

«Самая сложная AI-проблема — это непоследовательный смысл», — сказал Dion Hinchcliffe, руководитель CIO practice в The Futurum Group, отметив, что единый семантический слой может помочь CIO формировать одинаковый бизнес-контекст в разных системах и снизить потребность разработчиков вручную связывать метаданные и lineage.

Этот фокус на семантическом контексте также отражает более широкий сдвиг в том, как hyperscaler подходят к enterprise AI. Microsoft с Fabric IQ и AWS с Nova Forge идут похожим путем, выстраивая слои семантического контекста поверх корпоративных данных, чтобы сделать AI-системы более последовательными и проще операционализируемыми в масштабе.

Если подход Microsoft состоит в том, чтобы оборачивать AI-приложения и агентов бизнес-контекстом и семантическим интеллектом в предложениях Fabric IQ и Work IQ, то AWS хочет, чтобы предприятия встраивали бизнес-контекст в базовый LLM, подавая ему собственные данные.

Mike Leone, главный аналитик Moor Insights and Strategy, сказал, что подход Google, хотя и ближе к Microsoft, переносит гравитацию данных на один слой выше lakehouse — в возможности data catalog и semantic graph.

«Google и Microsoft решают одну и ту же проблему с разных сторон: Fabric — через унифицированную data foundation, а Google — через унифицированный семантический слой и слой контекста», — сказал Leone.

Даже поставщики программного обеспечения для аналитики данных сходятся в идее предлагать каталог, который может отображать семантический контекст из разных источников данных, добавил Leone, указав на Unity Catalog от Databricks и Horizon Catalog от Snowflake.

Семантическая точность может создать для CIO дополнительные риски

Однако подход Google к созданию интеллектуального семантического слоя, особенно его обновленный Knowledge Catalog, несет для CIO и свои риски.

Новая возможность автоматического уточнения семантического контекста в каталоге, по словам Jim Hare, VP analyst в Gartner, может усилить проблемы governance, особенно в управлении метаданными: «В сложных корпоративных доменах ошибки в выведенных связях или определениях потребуют постоянного контроля со стороны людей, владеющих предметной областью, чтобы сохранять доверие».

Hare также предупредил об operational- и cost-management-проблемах.

«Agent-driven workflows, охватывающие аналитические и операционные данные, потенциально в нескольких облаках, создадут новые сложности в observability, debugging и предсказуемости затрат, — сказал он. — Динамическое поведение агентов может порождать непрозрачные шаблоны потребления, поэтому chief data and analytics officers (CDAOs) придется жестко управлять распределением затрат, лимитами использования и операционными guardrails по мере развития этих возможностей».

Переход на новую архитектуру Google может усилить зависимость на уровне orchestration, что создаст проблемы с portability, предупредил он: «Выйти из managed semantics Google, агентов Gemini или абстракций BigQuery может оказаться сложнее, чем просто перенести данные».

Двунаправленная федерация как стратегический ход

Впрочем, такие компромиссы могут быть приемлемыми для компаний, которым важнее более тесная интеграция данных, чем гибкость.

В рамках новой архитектуры Google также предлагает межплатформенную совместимость данных через Apache Iceberg REST Catalog, который, по словам компании, позволит обеспечить двунаправленную федерацию и даст предприятиям возможность получать доступ, выполнять запросы и управлять данными в средах Databricks, Snowflake и AWS без перемещения данных и без платы за egress.

Для Stephanie Walter, руководителя практики AI stack в HyperFRAME Research, такая совместимость будет стратегически важна для предприятий, масштабирующих агентов в production, особенно если у них гетерогенные среды данных.

Leone из Moor Insights and Strategy, в свою очередь, видит в этом другой стратегический ход, который должен помочь удовлетворить спрос предприятий на доступ к средам Databricks, Snowflake и hyperscaler без дорогого перемещения данных.

Архитектура Agentic Data Cloud от Google также включает Data Agent Kit, который сейчас находится в preview. По словам компании, он предназначен для помощи предприятиям в создании, развертывании и управлении AI-агентами, осведомленными о данных, которые могут работать с управляемыми наборами данных, применять бизнес-логику и выполнять workflow между системами.

Robert Kramer, управляющий партнер KramerERP, сказал, что Data Agent Kit поможет специалистам по данным абстрагировать повседневные задачи, тем самым снизив барьер для внедрения agentic AI в рабочих процессах.

Однако Hare из Gartner предупредил, что предприятиям не стоит чрезмерно делегировать критические решения по управлению данными автоматизированным агентам без достаточной observability, механизмов валидации и человеческой проверки, особенно если downstream AI-системы зависят от этих агентов для непрерывных операций с данными.

Материал — перевод статьи с английского.

Оригинал: Google pitches Agentic Data Cloud to help enterprises turn data into context for AI agents

Подписаться на новости в Telegram