Гиперскейлеры и AI-нагрузки: почему предприятия переводят ИИ из public cloud в neocloud и on-premises

Прослушать статью

Для большинства предприятий AI-нагрузки останутся в public cloud достаточно долго, чтобы обеспечить быструю инновацию. Затем компании будут искать наиболее экономичные и гибкие варианты.

ИИ явно ускоряет спрос на cloud computing, но не так, как многие ожидали. Главная история сейчас — не о программных инновациях. Речь идет об огромном объеме капитала, который идет в физическую инфраструктуру, необходимую для поддержки ИИ в масштабе. Чипы, сетевое оборудование, системы питания и огромные дата-центры становятся стратегическим центром притяжения на рынке облаков, поскольку провайдеры спешат поддержать нагрузки для обучения моделей и inference.

Цифры трудно игнорировать. Ожидается, что технологические компании США, включая Alphabet, Amazon, Meta и Microsoft, потратят около 650 млрд долларов на AI-related infrastructure в 2026 году, тогда как в 2025 году этот показатель составлял примерно 410 млрд долларов, согласно анализу, на который ссылается Reuters. Такой рост говорит о важной вещи: ИИ — это не просто еще одна волна софта, которая аккуратно ложится поверх существующего cloud stack. Он заставляет перестраивать сам стек.

Эта перестройка глубоко затрагивает networking и data movement. Nvidia недавно объявила о планах инвестировать по 2 млрд долларов в photonics-компании Lumentum и Coherent, что показывает, где возникают точки давления. Проблема теперь не только в raw compute. Важным становится и то, насколько быстро данные могут перемещаться между процессорами, стойками и кластерами без недопустимых bottleneck и потерь на энергопотребление. По мере масштабирования AI latency, throughput и energy usage становятся первоочередными экономическими факторами.

Все это говорит о том, что ИИ определенно будет повышать спрос на public cloud computing, но делать это неравномерно. Public cloud providers остаются самым быстрым способом получить доступ к продвинутой инфраструктуре, глобальному масштабу и managed AI services. В то же время ценовая модель крупных постоянных AI workloads заставляет многие компании пересматривать, должен ли traditional hyperscaler model оставаться точкой по умолчанию для каждого этапа AI life cycle.

Большая часть ИИ начинается в public cloud

Когда компании экспериментируют, скорость важнее оптимизации. Public clouds дают командам немедленный доступ к GPUs, foundation model APIs, vector databases, orchestration tools, security controls и integration services. Они также позволяют быстро запускать пилоты без ожидания procurement cycles, расширения дата-центров или выделенных инфраструктурных команд.

При высокой неопределенности public cloud часто оказывается правильным выбором для first-generation AI. Компании пока не знают, какие use cases дадут ценность, какой объем inference traffic они увидят и какая architecture model в итоге выживет. На этом этапе возможность быстро пробовать многое важнее, чем выжимать каждый доллар из базовой инфраструктуры. Managed services снижают friction, а friction — враг раннего внедрения.

Именно поэтому мы видим сильный первоначальный спрос на AI в public cloud environments. Компании строят там chatbots, copilots, knowledge assistants, document automation systems и code generation tools, потому что cloud резко снижает порог входа. Он дает не только compute, но и полноценную operating environment для экспериментов с ИИ.

Системы ИИ следующего поколения требуют выбора

Второе поколение enterprise AI systems выглядит иначе. Когда use case доказывает свою ценность и использование становится постоянным, финансовая модель меняется. Нагрузка, которая казалась дешевой на этапе proof of concept, может стать шокирующе дорогой на production scale, особенно если она зависит от premium GPU instances, high-performance storage, постоянного network traffic и stacked managed services.

Именно здесь в разговор входит repatriation. Мы начинаем видеть сценарий, при котором компании строят AI systems первого поколения в public cloud, понимают, что работает, а затем переводят часть этих нагрузок обратно on-premises или на так называемых neocloud providers, которые предлагают AI-optimized infrastructure по более низкой цене.

On-premises deployment привлекателен, когда загрузка стабильна, data gravity высока, требования к governance строги, а масштаб организации достаточен, чтобы оправдать владение инфраструктурой или прямой контроль над ней. Варианты neocloud становятся привлекательными, когда компании по-прежнему хотят внешнего провайдера, но не готовы платить полную премию, часто связанную с крупными hyperscalers. Эти специализированные провайдеры все чаще выстраивают предложение вокруг плотной GPU capacity, более простой модели ценообразования и архитектуры, созданной специально для ИИ, а не для универсального enterprise IT.

Это важный паттерн внедрения, потому что он разрушает старое предположение о том, что cloud migration всегда идет только в одну сторону. В эпоху ИИ размещение workloads становится более гибким. Компании понимают, что лучшее место для экспериментов может оказаться не лучшим местом для steady-state production, а экономика ИИ наказывает архитектурную небрежность гораздо быстрее, чем традиционные enterprise applications.

ИИ и спрос на public cloud

Насколько сильно ИИ увеличит спрос на public cloud computing? Довольно сильно, особенно в ближайшей перспективе. Почти каждая крупная enterprise AI initiative, вероятно, в существенной степени будет задействовать public cloud — для model development, bursts для training, integration services, security tools или global deployment. Но было бы ошибкой считать, что весь спрос со временем останется заперт в traditional hyperscalers.

Некоторые AI workloads останутся в public cloud навсегда, потому что они bursty, распределены глобально, трудно предсказуемы или тесно связаны с cloud-native services. Другие нагрузки, особенно со стабильными паттернами использования и большим объемом inference, станут кандидатами на relocation. Решения будут определяться экономикой, а не идеологией.

Наиболее вероятный итог — более сегментированный рынок. Public clouds будут доминировать на фронтенде внедрения ИИ и продолжат играть большую роль в hybrid operations. On-premises environments снова станут важны для cost-sensitive, steady-state и compliance-heavy workloads. Neocloud providers вырастут как промежуточный вариант для компаний, которым нужна внешняя AI capacity без полной цены hyperscaler. Иными словами, ИИ увеличит спрос на public cloud, но одновременно усилит внимание к правильному выбору среды в долгосрочной перспективе.

Три фактора, которые стоит учитывать

Во-первых: скорость и стоимость — это разные метрики. Public cloud обычно дает самый быстрый способ поднять AI initiative, и эта скорость имеет реальную бизнес-ценность. Но архитектура, которая выиграла пилот, может уничтожить production budget. Компаниям нужна стратегия размещения с первого дня, даже если стартуют они в cloud.

Во-вторых: экономика AI workloads отличается от экономики традиционных приложений. Training, inference, data movement, storage и model serving могут взаимодействовать так, что быстро возникают непредвиденные расходы. Организациям следует моделировать не только использование compute, но и паттерны utilization, network flows и стоимость managed services вокруг core AI stack. Без такой дисциплины можно построить систему, которая технически элегантна, но финансово неустойчива.

В-третьих: будущая гибкость важнее краткосрочного удобства. Компании не должны строить AI systems настолько жестко вокруг proprietary stack одного провайдера, чтобы перенос стал болезненным или невозможным. Побеждать будут те компании, которые сохранят optionality и смогут переводить workloads между public clouds, on-premises environments и новыми neocloud platforms по мере изменения экономики, регулирования и бизнес-требований.

Настоящий вопрос не в том, выиграет ли cloud, а в том, как долго каждая AI workload будет оставаться в cloud. ИИ, без сомнения, создаст значительный новый спрос на public cloud computing. Для большинства компаний AI workloads будут оставаться в cloud достаточно долго, чтобы обеспечить быстрые инновации, но не обязательно навсегда.

Материал — перевод статьи с английского.

Оригинал: Will the hyperscalers own AI workloads forever?

Подписаться на новости в Telegram