SAP приобретает Dremio, чтобы усилить SAP Business Data Cloud и Apache Iceberg — ИИ для бизнеса

SAP приобретает Dremio, чтобы усилить SAP Business Data Cloud и Apache Iceberg

Прослушать статью

Два существующих партнера SAP, Snowflake и Databricks, предлагают похожие сервисы, но в Dremio есть важные отличия, которые могут быть значимы для страхов ИТ и AI в корпоративной среде.

Credit: Kittyfly / Shutterstock

В понедельник SAP объявила о планах приобрести Dremio, которая называет себя компанией в сегменте agentic lakehouse, за нераскрытую сумму. Сделка усложняется тем, что у действующих партнеров SAP, Snowflake и Databricks, есть похожие предложения, однако аналитики указывают на ключевые различия Dremio, особенно в ее способности работать с данными, пока они остаются в среде предприятия, а не должны находиться вне ее.

Одна из причин, которую SAP приводит в пользу сделки, заключается в том, что она теоретически упростит для ИТ-руководителей объединение данных SAP с данными не из SAP. Но более сильный аргумент связан со способностью Dremio делать сложные данные более пригодными для AI, чтобы их можно было быстрее и дешевле сделать полезными.

«Большинство корпоративных AI-проектов не приносят ценности не из-за самого AI, а потому что базовые данные фрагментированы, заблокированы в проприетарных форматах и лишены бизнес-контекста, который делает их значимыми», — говорится в заявлении SAP. «Итог — знакомый и дорогостоящий сценарий: пилоты, которые не масштабируются, медленная интеграция новых источников данных, дублирование инженерной работы и риски для соблюдения требований, когда организация не может объяснить, как было принято решение на основе AI. Dremio помогает устранить эту фрагментацию данных и трение при интеграции».

При этом, хотя SAP ссылается на аргумент качества данных, в корпоративном качестве данных есть множество элементов — например, устаревшие данные, данные из ненадежных источников или данные без осмысленного контекста, — которые Dremio не решает.

Тем не менее SAP заявила: «С Dremio SAP Business Data Cloud станет enterprise lakehouse на базе Apache Iceberg, которое объединит данные SAP и не-SAP, чтобы масштабно обеспечить agentic AI. Apache Iceberg — это отраслевой открытый табличный формат, и SAP Business Data Cloud будет нативно поддерживать его как основу». Это означает, что не потребуется перенос данных или преобразование форматов; данные SAP и не-SAP «могут сосуществовать на одной открытой основе, с федеративным аналитическим охватом по каждому корпоративному источнику данных».

Сложное сравнение

Аналитики и консультанты отметили, что любое сравнение Dremio с уже существующими партнерами SAP — Snowflake и Databricks — осложняется. Например, Dremio моложе и менее зрелая, чем Snowflake или Databricks, что делает ее менее идеальным выбором для предприятий.

Специалист SAP-стратегии Harikishore Sreenivasalu, CEO Aarini Consulting в Нидерландах, сказал, что и Snowflake, и Databricks были бы идеальными целями для поглощения много лет назад, но сегодня они слишком дороги.

«Databricks и Snowflake безусловно лучше [для enterprise IT], потому что у них зрелая платформа, они работают в multi cloud», тогда как Dremio «новый игрок на рынке, и ей нужно еще повзрослеть, чтобы быть готовой для enterprise. Ее аспекты безопасности тоже должны стать зрелее», — сказал Sreenivasalu.

Но Sreenivasalu добавил, что ситуация может легко измениться после того, как SAP инвестирует в команду Dremio и будет с ней работать. Он посоветовал CIO «остаться там, где вы сейчас, но следить за тем, как технологии будут интегрироваться. Слушайте дорожную карту SAP».

В посте в LinkedIn Sreenivasalu назвал сделку очень позитивной для SAP: «Это недостающий элемент. У SAP есть Joule. У SAP есть BTP. У SAP есть бизнес-процессы. Теперь у нее есть открытая data fabric, которая дает AI-агентам контекст, необходимый не только для ответов, но и для действий. Для тех из нас, кто строит на SAP BTP + Databricks + SAP BDC, это сигнал: lakehouse и мир ERP быстро сближаются. Будущее enterprise AI стало гораздо понятнее».

Устранение ограничений LLM

Во время пресс-конференции в понедельник утром руководители SAP сосредоточились на том, как эта сделка потенциально решает некоторые ключевые ограничения large language model (LLM) при работе с корпоративными данными, особенно в predictive analytics.

Philipp Herzig, chief technology officer SAP, сказал, что у LLM есть различные ограничения, отметив: «LLM не очень хорошо работают с числами» и испытывают трудности со структурированными данными, «где у нас очень много различий».

Практическая разница проявляется там, где системы пытаются предсказывать будущее, а не анализировать прошлое, например при вопросе, насколько хорошо товар ритейлера будет продаваться в течение следующих 10 месяцев, или при прогнозе вероятных задержек платежей и их влияния на прогнозируемый cashflow. «Именно здесь LLM сильно буксуют», — сказал Herzig. Он также подчеркнул, что способность Dremio работать с корпоративными данными, пока они остаются в on-prem-системах организации, критически важна для строго регулируемых предприятий.

Разница в локальных данных

Flavio Villanustre, CISO группы LexisNexis Risk Solutions Group, тоже считает главным преимуществом возможность обрабатывать данные локально.

Databricks и Snowflake обе предлагают сильный функционал, отметил он, но пользователям нужно переносить данные на их платформу и переформатировать их. После этого результатом становится центральное data lake для решения задач доступа к данным. «Dremio, с другой стороны, обеспечивает простой децентрализованный доступ к данным, позволяя пользователям обращаться к данным на месте», — сказал он. «Конечно, это может происходить в ущерб производительности обработки данных, но простота использования и гибкость могут перевесить потерю производительности». Еще один плюс — скорость внедрения: дни вместо недель или месяцев. «В этом есть существенная выгода».

Sanchit Vir Gogia, главный аналитик Greyhound Research, согласился с Villanustre, но лишь частично.

«Различие не настолько простое, как “Dremio оставляет данные на месте, а Snowflake и Databricks требуют все переносить”», — отметил он. «Snowflake и Databricks вложили значительные средства во внешний доступ к данным, совместное использование, открытые форматы, слои governance и интероперабельность. Поэтому было бы несправедливо описывать любую из них как старую модель “сначала перемести все”». Но, добавил он, более широкая логика верна. «[Dremio] исходит из предположения, что корпоративные данные уже распределены и первая проблема часто заключается в доступе, контексте, федерации и governance, а не в полном переносе. Для клиентов SAP это имеет огромное значение», — сказал он.

Это связано с природой наборов данных у многих корпоративных клиентов SAP.

«Большинство крупных ландшафтов SAP — это не чистые, централизованные среды данных», — отметил он. «Это brownfield-ландшафты: данные SAP, данные не-SAP, устаревшие хранилища, departmental lakes, региональные репозитории, унаследованные системы, данные партнеров и отраслевые платформы». Объяснять таким клиентам, что AI-готовность начинается с переноса всего в одну центральную платформу, может быть выгодно вендору, но для покупателя это огромный объем работы.

Aman Mahapatra, chief strategy officer технологической консалтинговой компании Tribeca Softtech в Нью-Йорке, отметил, что покупка Snowflake или Databricks уничтожила бы маркетинговый и sales pitch SAP.

«SAP не купила data warehouse. Они купили позицию в войне за open table format, и сроки сделки ясно показывают, почему Snowflake и Databricks никогда не были реалистичными целями», — сказал он. «Покупка любой из них мгновенно разрушила бы историю нейтральности SAP Business Data Cloud и оттолкнула бы половину клиентской базы в ту или другую сторону. Стратегическая позиция SAP зависит от того, что она находится над слоем warehouse, а не внутри него, и Dremio — это federated layer, который говорит и со Snowflake, и с Databricks, не заставляя SAP выбирать сторону».

Предположите, что все изменится

Mahapatra призывает CIO предприятий быть особенно осторожными.

«Для ИТ-руководителей, у которых этим утром действуют контракты с Snowflake и Databricks, в следующие два квартала ничего не изменится, но к первой половине 2027 года ожидайте, что SAP будет направлять новые AI-нагрузки в Business Data Cloud, независимо от того, что говорят сегодняшние пресс-релизы о партнерстве. CIO, которые уже сейчас планируют этот сценарий, будут вести переговоры с позиции силы», — сказал Mahapatra.

Compute и storage, которые предлагают вендоры data warehouse, быстро становятся commodity, сказал он, а «защищаемая ценность» в enterprise AI перемещается выше по стеку — к semantic layer, каталогу, графу lineage и бизнес-контексту, который позволяет агенту понимать, что означает «active customer» внутри организации.

«SAP только что купила набор инструментов, чтобы владеть этим слоем для любой компании, где в ядре стоит SAP», — сказал он. «Если у вас SAP-heavy-парк и вы запускаете аналитику на Snowflake или Databricks, ваши вендоры data warehouse скоро будут казаться менее стратегическими и больше похожими на высокопроизводительные compute backends».

Исправляет стратегическую ошибку

Jason Andersen, principal analyst в Moor Insights & Strategy, отметил, что уже довольно давно SAP настойчиво подталкивает предприятия хранить все данные в системах SAP. SAP не может просто так развернуть эту позицию назад, даже если бы захотела.

По мнению Andersen, сделка с Dremio вместо этого закрывает те «карманы данных», которые многие CIO, особенно в производстве и строго регулируемых отраслях, отказывались передавать SAP. Сделка с Dremio дает SAP возможность сохранить лицо и получить еще более высокий процент данных клиентов, сказал он.

«Производство крайне не любит выносить вещи в облако, и [CIO в производстве] оказывают яростное сопротивление переходу в облако», — сказал Andersen. «Эта [сделка] позволяет SAP получить доступ к большому объему данных, которые еще не перенесены в SAP».

Shashi Bellamkonda, principal research director в Info-Tech Research Group, сказал, что рассматривает шаг SAP по покупке Dremio как исправление стратегической ошибки, которую SAP допустила несколько лет назад, не разработав собственные возможности Apache Iceberg.

«Apache Iceberg — это открытый табличный формат, предназначенный для крупномасштабных аналитических наборов данных, хранящихся в data lake, своего рода мост между сырыми файлами данных и аналитическими инструментами», — сказал Bellamkonda. «[SAP] следовало сделать это раньше, а не ждать до 2026 года».

Этот материал первоначально был опубликован на CIO.com.


Материал — перевод статьи с английского.

Оригинал: SAP to acquire data lakehouse vendor Dremio