Пересборка data stack для AI: почему корпоративный ИИ упирается в данные, governance и измерение ценности

Прослушать статью

В партнерстве с Infosys Topaz

Искусственный интеллект доминирует в повестке советов директоров, но многие компании обнаруживают, что главное препятствие для осмысленного внедрения — состояние их данных. Если потребительские AI-инструменты впечатляют скоростью и простотой, то для масштабного внедрения в корпоративной среде нужна куда менее эффектная, но гораздо более важная основа: единая, управляемая и пригодная для задачи data infrastructure.

Этот разрыв между AI-амбициями и готовностью компаний становится одной из ключевых проблем следующего этапа цифровой трансформации. Как говорит Бавеш Патель, старший вице-президент Databricks, «качество этого AI и то, насколько он эффективен, действительно зависит от информации в вашей организации». Однако во многих компаниях эта информация по-прежнему фрагментирована между устаревшими системами, изолированными приложениями и разрозненными форматами, что почти не оставляет AI-системам шансов на создание надежных и контекстных ответов.

«По-настоящему важнейшее конкурентное отличие для большинства организаций — это их собственные данные, а затем и сторонние данные, которые они могут к ним добавить», — говорит Патель.

Чтобы корпоративный AI приносил пользу, данные нужно консолидировать в open formats, тщательно govern-ить и сделать доступными для разных подразделений. Без такой базы бизнес рискует получить «terrible AI», как резко формулирует Патель. Это означает переход от разрозненных SaaS-платформ и несвязанных dashboards к единой открытой data architecture, способной объединять structured и unstructured data, сохранять контекст в реальном времени и обеспечивать строгие controls доступа. Если фундамент заложен правильно, компании могут двигаться к измеримым результатам: повышать эффективность, автоматизировать сложные workflows и даже запускать новые направления бизнеса.

Ориентация на ценность особенно важна, отмечает Раджан Падманабхан, unit technology officer в Infosys, когда бизнесу нужна высокая точность output, влияющих на решения. Вместо того чтобы рассматривать AI-инициативы как отдельные проекты по инновациям, лидеры рынка привязывают внедрение AI напрямую к business metrics и используют frameworks governance, чтобы быстро определять, что дает результат, а что нужно быстро закрывать.

«Мы видим большой потенциал именно в повышении AI literacy у business users: им очень интересно понять, как вообще следует думать об AI», — добавляет Патель. — «Что значит AI, если посмотреть под капот? Какие элементы и строительные блоки нужно заложить — как с точки зрения технологий, так и с точки зрения обучения и enablement?»

Дальнейшие возможности значительны. По мере того как AI agents эволюционируют от copilots к автономным операторам, способным управлять workflows и транзакциями, выигрывать будут те организации, которые уже сейчас выстраивают правильный фундамент.

«Сейчас мы видим новый способ мышления: переход от system of execution или system of engagement к system of action», — отмечает Падманабхан. — «Именно так мы видим дальнейший путь».

Будущее AI в enterprise будет определяться тем, смогут ли компании превратить фрагментированную информацию в стратегический актив, который станет основой для более умных решений и новых способов работы.

Этот выпуск Business Lab подготовлен в партнерстве с Infosys Topaz.

Полная расшифровка:

Megan Tatum: Это MIT Technology Review, я Меган Татум, и это Business Lab — шоу, которое помогает бизнес-лидерам разбираться в новых технологиях, выходящих из лабораторий на рынок.

Этот выпуск подготовлен в партнерстве с Infosys Topaz. Недавние достижения в AI могли открыть впечатляющие новые промышленные применения, но опора на неподходящие data models означает, что многие компании упираются в стену. В частности, AI и agentic AI предъявляют к данным совершенно новый набор требований. Технологии нужен более широкий доступ, контекст и guardrails, чтобы работать эффективно. Существующие data models часто не справляются: они слишком фрагментированы или изолированы, а сами данные нередко низкого качества. Чтобы закрыть этот разрыв, им нужен upgrade, готовый к AI.

Две слова для вас: data reconfigured. Мои сегодняшние гости — Бавеш Патель, старший вице-президент по Go-to-Market в Databricks, и Раджан Падманабхан, unit technology officer по data analytics and AI в Infosys.

Добро пожаловать, Бавеш и Раджан.

Rajan Padmanabhan: Спасибо. Спасибо, что пригласили нас.

Bavesh Patel: Спасибо, что пригласили нас.

Megan: Отлично. Большое спасибо вам обоим за то, что присоединились к нам сегодня. Бавеш, начну с вас: когда мы говорим о AI-ready data, что именно имеется в виду? Какие новые требования AI предъявляет к данным и как это влияет на то, как их нужно структурировать и использовать?

Bavesh: Да. Отличный вопрос. Спасибо, что принимаете нас сегодня. Очевидно, весь мир очарован AI из-за той мощности, которую мы все видим как пользователи. AI теперь демократизирован для сотен миллионов пользователей. И когда мы думаем о том, как предприятия и бизнес используют AI, качество этого AI и то, насколько он эффективен, действительно зависит от информации в вашей организации, а это данные. И как мы выяснили, у большинства компаний данные как бы заперты в разных приложениях и разных системах. И очень сложно получить хороший обзор: что вообще есть в моих данных? Насколько им можно доверять? Насколько они свежие и актуальные? И все это затем подается в AI. Если у вас нет надлежащего понимания своих данных, если вы не можете гарантировать, что данные точные и пригодны для использования, чтобы AI мог ими воспользоваться, в итоге вы получите ужасный AI.

Мы видим, как многие клиенты тратят много времени на очистку данных, их упорядочивание, а также на то, чтобы доступ был правильно ограничен. И именно это обычно и становится топливом для хорошего AI.

Megan: Да. Это ведь основа основ, не так ли? Но, думаю, это легко упустить. Раджан, какую реальную разницу для компаний дает AI-ready data, когда они раскрывают полный потенциал AI и его приложений?

Rajan: Прежде всего, спасибо, что пригласили нас. Это большая честь. Думаю, продолжая мысль Бавеша, данные и AI — это почти синонимы. И так же consumer AI, enterprise AI и enterprise agentic AI различаются, потому что прежде всего бизнесу нужен context. Этот context из информации предприятия, которая не только structured, но и structured and unstructured, а также user-generated contents и вообще все формы данных, будет очень, очень важен, чтобы действительно правильно собрать context и чтобы правильно работала любая выбранная вами model. Именно здесь platforms вроде Databricks действительно помогают благодаря огромному выбору models — хотите ли вы строить собственные models или хотите ground the model на основе своих данных. Это будет очень, очень критично. Вот почему получение данных для AI имеет очень, очень большое значение.

Третий критический аспект — и он как раз станет одним из roadblocks для adoption of AI. Именно поэтому, если вы посмотрите, adoption of AI на потребительской стороне растет стремительно, но на enterprise-side компании испытывают трудности, главным образом из-за precision их output, потому что речь идет о business decisions: вы принимаете buy decision, sell decision или пытаетесь что-то рекомендовать, рекомендовать content. Таких use cases может быть 20. И здесь precision будет крайне важна. Мы видим у наших клиентов: у успешных клиентов precision выше 92% — это не просто желаемый ориентир, это must-have. Если это есть, то быть built on AI data сейчас — это и есть предпринимательский приоритет.

Megan: И, думаю, если мы уже обозначили, насколько это критично, то с чего предприятиям стоит начать на практическом уровне? Каковы основы при построении AI-ready data model?

Bavesh: Да. И, думаю, Раджан попал в точку. Предприятия решают совсем другой набор задач, чем consumer AI. Первое, что нужно сделать, — взять данные под контроль. Как я уже говорил, значительная часть данных заперта внутри. Нужно обеспечить возможность разместить данные там, где можно получить целостное представление о максимально возможной части data estate. Начинать это обычно стоит с перевода данных в open formats. Много ценных данных в организации сегодня спрятано в каком-нибудь proprietary SaaS app или в какой-то системе, и не все datasets связаны между собой, чтобы сформировать нужный context. Первый шаг — по сути проанализировать: что представляет собой ваше data estate? Какие ключевые куски данных нужно поместить туда, где можно начать понимать их и видеть, как они связаны друг с другом?

Нужно подумать о том, как выстроить data catalog, как работают связи между data assets, как наложить на это data governance — это и похоже на первый шаг. Если вспомнить, как был построен ChatGPT, он взял все данные интернета, затем агрегировал их, синтезировал и построил transformer models. А у предприятий, по сути, нет полного контроля над всеми своими данными внутри организации. Это та базовая основа, о которой действительно нужно думать. Второй момент: нельзя просто действовать ad hoc и запускать случайные AI projects. Нужно думать о business value. Многие наши клиенты подходят к AI гораздо более стратегически: они хотят вывести projects на доску с победами и затем создавать business value.

Построение AI value roadmap, связанной с тем, насколько хорошо организованы данные, — эти две вещи кажутся фундаментальными для того, чтобы успешно запустить AI в организации.

Megan: Этот вопрос ценности и правда очень важен, не так ли? Насколько я понимаю, Infosys и Databricks тесно работают вместе, чтобы проводить организации через эту трансформацию. Можете привести примеры эффекта, который вы видели у компаний, с которыми работали? Раджан, как это повлияло на то, как они могут интегрировать более сложные AI и agentic AI applications?

Rajan: Это очень, очень хороший вопрос. Что сделали Databricks и Infosys — мы в первую очередь разработали framework. И прежде всего все должно начинаться с value. У одной из крупнейших компаний по производству продуктов питания, с которой мы работали вместе, мы применили этот framework. Он состоит из шести разных элементов. Прежде всего очень важен value management, о котором говорил Бавеш. Мы вместе разработали 3M measurement framework — то, что мы называем adaptability, business value и responsible. Нельзя просто пойти и сделать garage project. Все должно быть measurable. Это должно быть responsible и соответствовать всем таким требованиям. Это крайне важно. И мы помогли клиенту приоритизировать то, что даст им наибольший value for money относительно тех инвестиций, которые они делают.

Второй важный момент: большинство предприятий сегодня — это не AI-born companies. Большинство родились в analog days; многие — в digital days. Есть компании, которые применяют AI для modernisation, потому что значительная часть вашей historical information на самом деле помогает формировать long-term context. И здесь мы тесно работали с некоторыми native tools Databricks, такими как Lakebridge или AI assistants, а затем строили поверх них composable services, чтобы помочь клиентам раскрыть ценность при переходе в Databricks. И еще один аспект, в котором мы помогали клиенту, — это как раз readying of data. Теперь вы принесли данные, теперь нужно привести и structured, и unstructured, и analytical, и все остальные аспекты.

И здесь, на третьем уровне, мы тесно работали с Databricks, используя все замечательные возможности внутри Databricks — будь то Unity Catalog, open formats или gateways и другие элементы. Мы смогли сделать данные доступными для этого клиента. Что действительно помогло нашему клиенту в третьей части, так это Agent Bricks, одна из differentiators. Он дает enterprise flavor. И здесь мы тесно работали, создавая некоторые наши industry-specific agents — будь то CPG, energy или FS. Для этого клиента мы взяли несколько CPG-specific use cases. Это могло касаться HR, procurement или marketing. И это действительно помогло клиенту построить business capability вокруг этого и развернуть восемь-девять use cases, которые мы называем products — agentic AI products, — и которые могут действительно принести им больше value, решая реальные business problems.

И такой комплекс: frameworks плюс набор suites of services, плюс наши solution assets, а также раскрытие value from Databricks — все это действительно помогло этим клиентам. И мы видим похожие patterns во многих успешных engagements, где нам удавалось постоянно драйвить value, применяя этот framework.

Megan: Похоже, это действительно дало ощутимый результат. Бавеш, Раджан упомянул здесь несколько инструментов из каталога Databricks. Знаю, что вы недавно запускали operational database для AI agents и apps. Как такая platform помогает компаниям в этом пути? Чем она отличается от других платформ на рынке?

Bavesh: Databricks вывела на рынок новое предложение под названием Lakebase, это по сути OLTP database, на которой можно строить AI apps. Если подумать, в enterprise есть два основных типа данных. Есть historical data — все, что уже произошло, и именно на этом строится analytics. У вас есть старая app system, куда вы поместили все historical data, а Databricks вывела на рынок то, что мы называем Lakehouse, — по сути data warehouse со всеми вашими данными, которые не являются operational по своей природе. Это historical data. И я думаю, концепция Lakehouse действительно продвигает AI вперед, потому что у многих наших клиентов внутри бизнеса тысячи пользователей, которым нужны данные. И они пошли по BI route, то есть строят dashboard или report.

У большинства организаций тысячи таких dashboards и reports разрослись по всей компании, и их потом нужно кастомизировать. Пользователям внутри бизнеса просто требуется слишком много времени, чтобы получить доступ к данным. AI теперь делает это гораздо проще с точки зрения analytics: мы можем democratize access to the data, а это и было holy grail для большинства data teams. Им нужно просто уйти в сторону и дать нужные данные нужным людям внутри бизнеса с правильным доступом.

С продуктом вроде Genie в Databricks можно просто использовать English language или любой другой язык, чтобы задавать вопросы данным. И он вернет ответы в context. Он даст не просто то, что даст ChatGPT, — информацию по теме из интернета, — а скажет: «Почему мои показатели продаж в апреле не соответствовали тому, что я ожидал?»

Он даст root cause analysis, основанный на данных вашего предприятия. Genie станет одним из тех инструментов, которые действительно важны, потому что он по-настоящему democratize data внутри бизнеса. Это и есть мир OLAP, которым является Lakehouse. А совсем недавно мы вывели на рынок то, что называем Lakebase, — это мир OLTP. Мы видим, что в организациях теперь разворачиваются agents, и этим agents нужно место, где хранить всю orchestration, весь context происходящего в конкретном workflow. С одной стороны, у вас есть пользователи, которые просто задают вопросы. С другой — следующий этап будет связан с автоматизацией целого business process. Если взять такую функцию, как создание campaign в marketing, то там много инструментов и много шагов.

Agent может прийти и действительно автоматизировать большую часть этого. Но на backend этого agent вам понадобится real-time database, чтобы отслеживать все, что он делает. Именно это Databricks и вывела на рынок — OLTP Lakebase solution. Наша инновация заключается в том, что это современный тип Postgres database, где мы разделили compute и storage — очень похоже на то, что мы сделали с data Lakehouse и data warehouse. Но в Lakebase данные находятся в одной копии внутри вашего cloud storage, а compute отделен и работает serverless. Можно делать branching и очень быстро поднимать OLTP database. Мы увидели, что agents сами начинают поднимать эти Lakebase, потому что могут очень быстро запустить экземпляр, держать его включенным, выключать, когда нужно, делать копию.

Agents уже делают это, и им нужна скорость, им нужно cost-effective решение. И прелесть всего этого в том, что если объединить OLTP — то есть Lakebase и real time — и OLAP, у вас появляется одна system for all your data. Вам не нужно копировать данные туда-сюда, не нужно управлять всеми permissions, можно задавать context прямо к ним. Мы видим, что AI apps — это действительно будущее того, как работают компании: они уберут bottlenecks, которые люди сейчас закрывают повторяющейся работой, и автоматизируют это с помощью LLMs и всех этих новых технологий. Мы хотим быть default для их поддержки, потому что считаем, что наша Lakebase technology будет faster, cheaper и more secure для AI database.

Megan: Похоже на настоящий game changer. И мы уже несколько раз касались этой идеи ценности. Мы знаем, что для senior leaders сейчас очень важно оценивать коммерческую ценность инвестиций в AI. Насколько важен этот аспект измерения ценности, когда речь идет о создании AI-ready data systems, Раджан? Как организациям убедиться, что они отслеживают, что работает, а что нет?

Rajan: Это имеет первостепенное значение, и большинство успешных AI implementations или agentic AI implementations действительно требуют value measurement. Я продолжу пример клиента, о котором говорил, — крупной компании по производству продуктов питания, глобальной компании, — чтобы объяснить этот вопрос. Я хочу использовать метафору. Когда появился первый digital world, мы получили много analytics, в основном вокруг определения performance management KPIs; fact-based decisioning и другие вещи постепенно развивались со временем. Обычно такие metrics крайне важны, чтобы измерять, как работает функция, как идет бизнес. По той же логике для value measurement, если взять тот же пример клиента, крайне важно сопоставить ожидаемый outcome.

В данном случае — как оптимизировать затраты на direct and indirect purchases? То есть, применяя AI, я хочу определить области, где могу оптимизировать spending. А значит, один из ключевых показателей — какова ваша indirect expense classification, какие расходы были классифицированы и насколько сильно вы смогли их сократить за счет внедрения этого решения. Установление этих measures и metrics крайне важно. И когда вы зададите базовые metrics и measurement, — а прелесть в том, что некоторые из этих metrics, если продолжить мысль Бавеша, Databricks умеет давать через metrics view, features, tools и другие возможности, — вы сможете преобразовать AI telemetries и business telemetries, поступающие из ваших приложений, в measurable metrics в виде outcome, который потом можно реально измерить с помощью Genie room for value management measurement.

Дальше возможны два сценария: use case, products, которые мы, как я сказал, создали для этого клиента — будь то на procurement стороне или на marketing research стороне, — если вы видите value, например, за счет VAC или за счет reachability, то есть насколько широк охват, вы можете либо ускорить этот use case и дальше донастроить продукт, чтобы масштабировать его, либо, если понимаете, что он не приносит value, или вы не видите value, которое он должен дать, можно очень быстро принять решение о fast failure вместо того, чтобы пытаться его во что бы то ни стало довести до рабочего состояния. Можно понять ситуацию и затем pivot на что-то другое.

Тут есть три аспекта. По нашему опыту, не только с этим клиентом, но и с другими клиентами из industrial manufacturing, FS и energy, если заранее выстроить metrics-driven valuation method и затем использовать возможности, чтобы превращать telemetries и signals в measurement — то, что мы называем AI compass room, — бизнес-стейкхолдеры, будь то marketing office, supply chain office или CFO office, смогут говорить: «Вот что это должно было сделать, вот текущий measurement, а вот где оно проваливается — это помогает нам pivot». И это действительно будет драйвить и democratize AI, весь agentic слой по всей компании, а значит, и value.

Это одна из критически важных вещей, которые enterprise должен делать. И именно здесь тот six-part framework, о котором я говорил: применять framework вроде value office, применять ready for AI, применять transformation fabric. Затем третья часть — governance, которая и будет entrepreneur этого процесса. Потом управление операциями не на основе SLA, а на основе experience level agreements и business metrics, чтобы постоянно измерять все это — совмещение этих шести слоев крайне важно. Именно тогда мы видим, что организации становятся успешными, и некоторые из наших проверенных примеров как раз делают то же самое. С точки зрения измерения это действительно критично для организаций.

Megan: Столько практических способов оценить value. И вы затронули governance, а влияние AI на governance — еще одна огромная тема для senior leaders, и взаимодействие с данными здесь играет ключевую роль. Насколько наличие правильных governance и security protocols является неотъемлемой частью AI-ready data? Бавеш, с какими сценариями должны справляться эти системы? Что это значит для data models?

Bavesh: Это уже становится своего рода prerequisite для успешного AI project. Думаю, MIT публиковал отчет, в котором говорилось, что 95% этих новых AI projects на самом деле не дают business value. Одна из главных причин — можно прототипировать, быстро поднимать и vibe code пилот, но когда вы действительно переводите workload в production, понимаете, что governance становится критически важным.

Так что же мы вообще подразумеваем под governance? Думаю, первое — привести данные в порядок, как я уже говорил, в open formats. Сейчас большинство компаний понимают: то, как они взаимодействуют с клиентами, как разрабатывают drug, как одобряют человеку повышение кредитного лимита — вся эта enterprise information и есть их competitive advantage. Потому что любой может пойти и использовать frontier model вроде ChatGPT или Claude, к которым у всех есть доступ.

По-настоящему главное конкурентное отличие для большинства организаций — это их собственные данные, а затем и third-party data, которые они могут добавить. Перевод данных в open format, чтобы понимать их, и само понимание данных — вот где возникает governance. Потому что, когда вы думаете о governance, вам прежде всего нужно уметь находить данные.

Если я end user или если я строю AI product, я хочу знать, какие данные мне доступны. Могу ли я доверять этим данным? Насколько они свежие? Они идут из моего analytics world или мне нужна real-time system, такая как OLTP system? Мне нужно найти данные. И мне также нужно убедиться, что доступ контролируется так, чтобы не создавать больших проблем для организации. Это критично. Если у меня есть множество PDF-файлов с purchase orders, кто вообще имеет доступ ко всем этим данным?

В clinical trial, например, в healthcare, нужно быть уверенным, что люди из разных trials не могут видеть patient data. Возможно, model, использованная при построении, работала across trial. У кого есть доступ ко всем данным? У кого — только к части данных? Об этом действительно нужно думать. Мы также смотрим на semantics данных. Раджан поднял это в самом начале: что такое context? Как нам думать о metrics и обо всем том, что business users держат в голове? Это нужно где-то кодировать. У нас в Databricks есть product под названием Unity Catalog, где можно выполнять discovery, access и business semantics. И вы также хотите делиться данными.

А в мире agents мы видим то, что называется agent sprawl. Очень быстро, примерно так же, как SaaS applications стали повсеместными внутри любой организации, потому что они действительно решали business problem. Вы приходите в какое-то business unit и говорите: «Мне нужно делать credit underwriting» или «У меня use case по prior authorization» — и так можно перечислять тысячи use cases. Для этого есть SaaS app. Точно так же появится мир, в котором agents будут играть свою роль, и у большинства организаций будет много постоянно работающих agents. Но реальность в том, что как agent отработал? Какой был feedback loop от пользователя? Какова стоимость запуска этого workload и не растет ли она резко? И если у вас нет способа мониторить, понимать и отслеживать все вопросы, ответы и реакции в масштабе, вы окажетесь в большой проблеме. Это может реально навредить вашей организации, потому что пользователям будет очень непонятно, что делать.

Если смотреть на governance, большинство организаций начинают понимать, что им нужно разобраться, что именно они уже внедрили с точки зрения systems, process и tooling. Начать с одного use case, построить под него governance, но делать это так, чтобы потом это можно было повторять. AI не будет про один или два use case. Выиграет тот, кто выстроит flywheel из множества use cases безопасным, secure и cost-effective способом, который приносит business outcome. Если governance не применять, будет очень трудно.

В Databricks мы сделали большую ставку на governance четыре или пять лет назад. Это одна из главных причин нашего роста сейчас, потому что мы можем гарантировать, что в ваш AI попадают качественные данные. Можно использовать Genie, можно использовать Agent Bricks и можно строить apps на базе Lakebase. Но все это по-настоящему не работает без governance. Это и есть то, что мы называем brain внутри Databricks.

Большинство наших клиентов проводят очень много времени внутри Unity Catalog. И хорошая новость в том, что AI помогает быстрее настраивать governance. У нас есть клиент, который три года назад пытался собрать все data assets по всем доменам — из customer, из loyalty app, из e-commerce engine. Им нужно было вручную картировать все эти data assets. Теперь AI делает большую часть этой работы за них. Human in the loop просто проверяет результат.

Мы сделали это гораздо проще с помощью AI. Мы всегда думаем об AI как о business use case и результате, и, думаю, именно там будет наибольшая ценность. Но внутри Databricks мы используем AI в самой платформе, чтобы упростить эксплуатацию и упростить предоставление всех нужных вещей для вашего бизнеса. Это крайне важная часть того, как мы планируем инновации по мере того, как AI начинает по-настоящему входить в рынок.

Megan: И Раджан, Бавеш уже немного коснулся этого, но добавляет ли интеграция Agentic AI еще один слой сложности? Какие новые вопросы governance это поднимает?

Rajan: Это очень, очень справедливый вопрос. Я хотел бы объяснить это через метафору. Мы входим в мир self-driving cars, robotaxis и всего подобного. Хотя это и ведет нас в autonomous world, все равно есть правила, которым нужно следовать, когда вы едете по дороге. Я привожу эту метафору потому, что здесь действительно требуется соблюдение правил, а разные topographies, разные условия зависят от того, где именно вы едете, и это будет очень, очень важно. Сложность, которую добавляют agents, — это по сути то, как вы работаете в рамках этих ограничений.

Например, как UTO я могу делать 10 вещей, но, скажем, я не могу одобрить скидку более 70% или не могу выдать кому-то бонус, потому что это часть зоны ответственности CFO, и agent должен это понимать.

Это один аспект — применять вокруг этого constraints и следить, чтобы agents им следовали. Второй набор сложности — tools to access. Как business, в сегодняшнем мире, когда вы определяете process, для некоторых процессов нужен определенный набор tools, чтобы действительно привести их в действие. Есть определенные entitlements: только уполномоченные люди могут делать определенные вещи в зависимости от их identity, в зависимости от потребности или ситуации, и это нужно govern-ить. Третий момент — information sharing. MCP и другие подходы хороши, UCP и другие подходы хороши, но один критически важный вопрос — что именно нужно делиться, а что не нужно. И это ключевые considerations.

Последняя часть — learning and relearning. Иногда, если вы научились хорошим вещам, их следует сохранить. Иногда лучше полностью убрать что-то и переоценить это по-новому, заново научиться этому в новой форме. Это все критически важно. В том же ключе для agents это будет крайне важно, потому что, когда вы используете agents в enterprise, вам нужно знать, понимать и соблюдать определенные compliance-related rules, business-related constraints, а также entitlements identity. И shared rules, которые применяются к физическому человеку, начнут применяться и к agent. Вот почему это будет очень важно. Для этого нужен новый набор operating systems. Это не значит, что нужно отказаться от старого. Я просто интерпретирую то, как Бавеш говорил о Unity Catalog.

Лучшее, что мы видим, и то, что реализуют некоторые клиенты, — это расширение Unity Catalog и возможностей, когда теперь можно catalog tools, catalog MCP, а также catalog agents, а затем govern these agents на основе constraints и ground them на основе constraints.

Это будет очень, очень важно. Делать это не потом, а начинать как часть стратегии и включать это как одно из критических измерений при оценке value — тоже крайне важно для организации. Это как убедиться, что вы не только построили автономный автомобиль, но и что он ездит по правилам дороги и не уходит в rogue mode.

Megan: Много пищи для размышлений. Очень интересно, спасибо. И напоследок — быстрый взгляд вперед. Мы все знаем, как быстро развивается AI и Agentic AI. Для тех организаций, которые смогут уже сейчас поставить AI-ready data в приоритет, какие самые перспективные use cases вы видите в ближайшие несколько лет, Бавеш?

Bavesh: Думаю, уровень воодушевления сейчас на пике. Мы видели очень большие инвестиции в AI. Думаю, причина этого воодушевления в том, что можно посмотреть на early adopters и увидеть огромные gains, которых они достигают. Я скажу одно: есть три категории компаний, и те, которые, как мне кажется, идут хорошо, многие из них начинали просто с copilots и инструментов, которые быстро отвечают людям. Представьте это как повышение продуктивности отдельного человека. Это первая фаза. И ROI там был довольно спорным. С такими решениями, как Genie, это становится намного эффективнее, потому что они работают на ваших данных, а ваши данные контекстуализированы внутри вашей организации. Думаю, именно в этой области будет много инноваций. Мы увидим, как большинство организаций начнут просто доставлять нужную информацию нужному человеку в нужное время. И для многих компаний это давняя мечта.

Второй сценарий — автоматизация целых business processes. Мы видим функции внутри marketing, как я уже описывал, или, например, процесс rebates в компании. Там целая куча шагов, когда нужно зайти в три разных app, выгрузить data from Excel и перенести ее туда. Тысячи людей делают очень трудоемкую, однообразную и повторяющуюся работу. Эти agents действительно помогут не только резко повысить productivity для business process, но и просто ускорят все. Процессы, которые занимали недели, теперь будут занимать дни. Процессы, которые занимали дни, теперь будут занимать часы и даже минуты.

Одна тенденция, которую мы заметили, — AI-мир очень динамичен. В мире, где много разных игроков, вы должны думать о first principles: каковы основы? Нужно думать о владении своими данными, о том, чтобы иметь контроль над structured и unstructured data. На это нужно накладывать governance. Но есть еще одна вещь, которую важно не допустить: не оказаться в ловушке vendor lock-in.

Сегодня, если задуматься, Gemini очень хорош в multimodal. Если у вас есть изображения, видео и подобные вещи, Gemini просто очень силен. Если вы пишете code, Claude очень хорош. Если вы решаете определенные вопросы introspection, ChatGPT очень хорош. На самом деле вам нужна open data platform, где можно строить свой open AI в нескольких clouds — именно это мы и создали в Databricks.

Думаю, это поможет и со вторым пунктом: вы сможете выбирать и комбинировать, потому что при создании этих agents вы не обязаны быть привязанными только к одной модели. Нужно выбирать лучшее качество, лучшую security, лучший ROI и цену для конкретного workload. Для одной нагрузки может использоваться несколько моделей, и они могут быть даже специфичными для отрасли. Вам нужна система и platform, которая может справиться с этой сложностью.

Думаю, третья категория — это business reimagination. Многие об этом говорят: да, вы возьмете данные, сделаете их доступными и дадите всем доступ к ним. Вы сделаете существующие процессы намного эффективнее. Но третье — из этого появятся совершенно новые вещи.

У нас есть очень крупный клиент-банк, который создал продукт, которого у него не было год назад. По сути, machine learning и LLMs помогают treasury departments прогнозировать, какими будут их балансы, потому что у них стало больше данных под рукой. Исторически данные очень долго доходили до bankers. Они не могли по-настоящему предсказать, каким будет balance для treasury department. Посмотрите на крупную enterprise-компанию: они теперь создали совершенно новое data AI solution, которое монетизируют, и за первые шесть месяцев оно принесло сотни миллионов долларов. Мы видим, как появляются совершенно новые lines of business, и это очень захватывающе, потому что именно здесь будет происходить большая часть трансформации. Будет productivity. Будет автоматизация на уровне business process. А потом появятся и совершенно новые вещи, которые мы даже не могли себе представить.

Мы уже видим ранние сигналы этого во всех отраслях. Ритейлеры получают data на уровне часа и даже минуты, чтобы гораздо теснее интегрироваться со своими supply chains. Мы видим более точечные customer 360-degree use cases, где как ритейлеры или как consumers мы раздражаемся из-за рекламы, но теперь она настолько контекстуальна, и у вас так много информации о том, что действительно важно для target customer, что вы даете им value-added информацию, и это сильнее вовлекает их. Очень много инноваций происходит в agentic commerce и в вещах вроде concierge и virtualized shopping.

Посмотрите на любую отрасль — там определенно есть новые способы делать вещи. В этом и есть самое захватывающее в AI, но нельзя уходить слишком далеко вперед, не думая о фундаменте. Вы уже упоминали это раньше: open data platform, правильный governance, понимание historical analytical data и application data, которая будет real time, — хорошая база позволит вам масштабироваться, двигаться быстрее и конкурировать в новом мире.

Мы очень воодушевлены тем, что видим у наших клиентов и что они строят. Честно говоря, это лучшая часть моей работы в Databricks: наши команды приходят к клиентам и спрашивают: «Каких outcomes вы добиваетесь?» Ранние сигналы очень позитивные. Мы видим, что компании, которые серьезно относятся ко всем базовым элементам и методично строят truly outcome-based AI solutions, — те 5% проектов, которые действительно успешны, — они успешны невероятно сильно. Именно поэтому мы растем как компания: когда у вас появляется хороший project, это получает visibility у executives.

И последнее: исторически большая часть технологий была сосредоточена в IT department. Бизнес определял, как он хочет выходить на рынок, как будет конкурировать и какие продукты и услуги предлагать. IT был enabler и во многих случаях становился cost center, сведенным к рационализации портфеля расходов и инструментов.

Но теперь мы видим, что бизнес с AI берет лидерство: он хочет понимать, хочет знать: «Что я могу делать сейчас, чего раньше не мог?» Мы видим большой потенциал именно в AI literacy у business users: им очень интересно понять, как следует думать об AI. Что значит AI, если посмотреть под капот? Какие pieces и building blocks нужно заложить — как с точки зрения технологий, так и с точки зрения обучения и enablement? Мы много работаем с executives, помогая им пройти этот путь. И мы определенно видим впереди много потрясающих возможностей.

Megan: Да. Столько инноваций происходит. И в завершение — что больше всего вдохновляет вас, Раджан?

Rajan: Думаю, Бавеш уже многое сказал, но я это вижу так: сегодня мы в основном говорим о labor shift. Это значит раскрытие потенциала человека или переход от текущего способа работы к новому способу работы, где игра идет в сторону большей эффективности. Сейчас это в основном efficiency game. Думаю, именно это мы и наблюдаем, и большинство успешных use cases относятся как раз к labor shift. Но что действительно многообещающе — это два типа сдвига, business shifts.

То, что мы видим как новый способ мышления или новую вещь, которая появляется, — это переход от system of execution или system of engagement к system of action. Вот так мы видим road ahead. И здесь как раз важны те моменты, о которых я говорил. Бизнес хочет получить доступ к этому, но как это действительно дает реальную разницу?

Один классический пример, который я хорошо вижу и который мы реализовали для одного клиента, в основном в manufacturing, — это lifecycle создания продукта, а затем публикация content вокруг продукта в соответствии с разными B2B marketplaces. В некоторых случаях речь идет не просто о рекомендациях или создании, а о том, что вы действительно можете переосмыслить этот процесс, который раньше требовал пять разных departments, а теперь может выполняться гораздо быстрее, и при этом дает veracity в decisioning и в том, как вы можете actionize.

Третья часть, думаю, — это то, как развивалась commerce. Речь уже идет не только об agentic commerce, но, как мне кажется, мы видим agent to agent commerce, agent to human commerce, agent to agent payments, agent to human payments, а затем — content monetization.

Это новый набор business opportunities, вроде создания новых business agentic products. Это может быть для family techs, для consumer side или для industrial technology side. Я бы назвал это economy shift, labor shift, business shift, потому что это принесет новый набор system of actions, переводя их от system of executions или типичного SaaS application с bolt-on agentic — так называемого agentic application. Это будет крупная трансформация, и она уже идет. Но с технологической стороны, что крайне важно для entrepreneuring, так это то, что сегодня у вас есть data, analytical data, operational data, а затем intelligence — это разные грани одного и того же.

Думаю, и этот analytical core, и operational core в итоге действительно сольются в одно. Поэтому мы так воодушевлены релизами Lakebase и другими подобными решениями — именно так будет развиваться будущее. Когда компании действительно думают о readiness для AI technology use cases, им стоит задуматься: как создать этот unified core для нового мира?

Вторая часть — людям нужно переосмыслить сегодняшний день. Если взять SAP как пример: у вас сотни edge applications, business applications нужно интегрировать друг с другом. Обычно это приводит к sprawl интеграций. На уровне одного technology use case люди могут спросить: «Как мне создать domain-based service mesh поверх этого unified core и сделать его более agentic integration ready?» Именно это один из технологических use cases, который мы советуем клиенту.

Думаю, сейчас, с учетом множества новых направлений, которые появляются вокруг SAP, BDC с Databricks и zero-based integration, компании заново переосмысливают, как им нужно интегрироваться и как вообще делать вещи.

Третья часть, думаю, со стороны technology investment и technology use cases, о которых я бы говорил, — не просто рассуждать о сегодняшнем дне. Сейчас время, когда вам нужно переосмыслить то, как вы владеете людьми, FTEs в вашей организации. Agents станут вашими новыми FTEs.

Это означает, что новый технологический paradigm будет заключаться в создании co-intellects внутри организации. То есть вам нужно инвестировать в то, что мы называем agentic grid — unified agentic fabric, где каждый agent может реально сотрудничать и интегрироваться, строясь поверх того же unified operational analytical core, с unified agentic integration поверх него. Это создаст новый набор experiences — agentic experiences вместо традиционных или conversational experiences.

Затем новые способы collaboration станут одними из ключевых аспектов, о которых людям нужно думать с технологической точки зрения. Для начала я бы сказал: начните смотреть на это через data standpoint, выстраивая unified core, unified integration и слой collaboration как для sharing и сотрудничества с intelligence, так и для agentic collaboration — все это под одной оболочкой governance. Это будет тот ключевой use case, о котором никто не пожалеет, и он даст действительно 100X отдачу от инвестиций.

Megan: Впереди, безусловно, не будет недостатка в захватывающих событиях. Большое спасибо вам обоим за этот разговор. Это были Бавеш Патель, старший вице-президент по Go-to-Market в Databricks, и Раджан Падманабхан, unit technology officer по data analytics and AI в Infosys, с которыми я разговаривала из Брайтона, Англия. На этом выпуск Business Lab завершен. Я ваша ведущая, Меган Татум. Я contributing editor и ведущая Insights, подразделения custom publishing MIT Technology Review. Мы были основаны в 1899 году в Massachusetts Institute of Technology, и нас можно найти в печати, в интернете и на мероприятиях по всему миру каждый год. Подробнее о нас и о шоу смотрите на нашем сайте technologyreview.com. Шоу доступно там, где вы обычно слушаете подкасты, и если вам понравился выпуск, мы будем рады, если вы уделите минуту, чтобы оценить и оставить отзыв. Business Lab — производство MIT Technology Review, этот выпуск создан Giro Studios. Спасибо за прослушивание.

Deep Dive

Artificial intelligence

OpenAI вкладывает все силы в создание полностью автоматизированного исследователя

Эксклюзивный разговор с главным научным сотрудником OpenAI Якобом Пачоцки о новом большом вызове компании и будущем AI.

By

Как Pokémon Go помогает доставочным роботам видеть мир с точностью до дюйма

Эксклюзив: AI-спин-офф Niantic обучает новую world model на 30 миллиардах изображений городских ориентиров, собранных игроками.

By

Хотите понять текущее состояние AI? Посмотрите на эти графики.

Согласно AI Index Stanford 2026, AI несется вперед, а мы едва успеваем за ним.

By

Этот стартап хочет изменить то, как математики занимаются математикой

Axiom Math раздает мощный новый AI-инструмент бесплатно. Но еще предстоит понять, ускорит ли он исследования так сильно, как надеется компания.

By

Оставайтесь на связи

Узнавайте о специальных предложениях, главных материалах, предстоящих мероприятиях и многом другом.


Материал — перевод статьи с английского.

Оригинал: Rebuilding the data stack for AI