Запуск ИИ в cloud проще — и дороже — ИИ для бизнеса

Запуск ИИ в cloud проще — и дороже

Прослушать статью

Будем честны о том, что происходит на рынке: public cloud стал для ИИ кнопкой «сделать просто». Он дает мгновенный доступ к вычислениям, хранилищу, управляемым сервисам, экосистемам foundation model, инструментам автоматизации и глобальному охвату. Для компаний, которым нужно быстро запуститься, с этим трудно спорить. Не нужно годами поднимать инфраструктуру, нанимать специализированные operations-команды или проектировать собственную масштабируемую среду, прежде чем протестировать первый use case.

Именно поэтому внедрение продолжается даже на фоне более сложных разговоров о cloud resilience. Эта статья о росте рынка cloud ясно показывает эту тенденцию. Компании не отступают от hyperscale cloud, несмотря на многочисленные сбои. Они продолжают двигаться вперед, потому что преимущества agility, scalability и rapid deployment слишком ценны, чтобы их игнорировать. Cloud глубоко встроен в бизнес-процессы, и для многих организаций отказ от него перечеркнул бы годы, а то и десятилетия прогресса.

В этом и состоит смысл «easy button». Cloud снимает первоначальную нагрузку по созданию и эксплуатации всей тяжелой инфраструктуры своими силами. Он централизует возможности. Он сокращает time to value. Он позволяет руководству сказать «да» ИИ-проектам, не финансируя сначала долгую трансформацию инфраструктуры. Для советов директоров и CEO, которым нужно показать прогресс по ИИ уже сейчас, это очень привлекательное предложение.

Экономика не так проста

В азарте часто упускают то, что удобство имеет нарастающую структуру затрат. Те же свойства, которые делают public cloud привлекательным для ИИ, делают его дорогим в эксплуатации на масштабе. Вы платите не только за базовую инфраструктуру, но и за абстракцию, acceleration, service layering, managed operations, premium tools и маржу провайдера. По мере успеха ИИ операционные расходы тоже растут.

Это важно, потому что ИИ — не история про одно приложение. Компании редко останавливаются на одной модели, одном пилоте или одном use case. Им нужны десятки решений для customer service, software development, supply chain planning, security operations, analytics и внутренней productivity. Каждый доллар, направленный на одну дорогую cloud-based AI-нагрузку, — это доллар, которого не хватит на следующую. Именно этого стратегического вопроса слишком многие компании не замечают.

Вопрос не в том, может ли cloud запускать ИИ. Разумеется, может. Во многих случаях это самый быстрый путь к ценности. Более важный вопрос — хватает ли долгосрочных операционных затрат в бюджете на то, чтобы строить портфель ИИ-решений, а не несколько разрозненных побед. Если ответ отрицательный, премия за удобство начинает выглядеть не как ускорение, а как ограничение.

Операционный компромисс

Эта проблема больше, чем просто сбои. Речь об экономическом поведении hyperscaler’ов и об операционных допущениях, к которым приучают компании. Крупные провайдеры постоянно находятся под давлением: нужно одновременно снижать издержки и расширять набор сервисов. Это означает ускоренные релизы, более жесткие операционные бюджеты, больше автоматизации и меньше по-настоящему опытных инженеров, которые могли бы обеспечивать контроль. Надежность смещается от ожидаемой нормы к чему-то ближе к «достаточно хорошо».

Azure, как сообщается, ежедневно генерирует, тестирует и разворачивает десятки тысяч строк кода, созданного ИИ. Это далеко не тривиальная операционная модель. Она отражает платформу, которая непрерывно расширяется, становится менее прозрачной и труднее управляемой, даже когда компании размещают поверх нее все более стратегические workload’ы.

Покупателям ИИ важно понимать это по двум причинам. Во-первых, кнопка «easy cloud» превращается в кнопку «cloud dependency». Вы не просто потребляете вычисления. Вы привязываете свою ИИ-дорожную карту к экономическим стимулам провайдера, его операционной дисциплине и готовности выбирать между resilience и расширением выручки. Во-вторых, когда cloud становится default-домом для ИИ, компаниям часто приходится тратить больше на снижение рисков. Multiregion-дизайн, failover architecture, monitoring, governance и vendor management — все это входит в реальную стоимость эксплуатации.

Все это не означает, что компаниям следует отказываться от public cloud. Но входить в такое партнерство нужно с открытыми глазами и понимать, что easy button редко бывает дешевой кнопкой.

Провайдеры cloud будут богатеть и дальше

Экономическая логика здесь проста. Провайдеры понимают, что компании вряд ли развернутся назад. Cloud слишком глубоко встроен, слишком связан с другими системами и слишком важен для ongoing modernization. Сбои вызывают раздражение, но обычно не настолько сильное, чтобы спровоцировать массовый исход. В результате складывается рынок, на котором провайдеры могут и дальше расширять ИИ-сервисы, привлекать больше workload’ов и наращивать выручку, в то время как клиенты берут на себя все больше операционной нагрузки.

Эта нагрузка не ограничивается счетами за compute и storage. Она включает архитектуру, необходимую, чтобы переживать сбои провайдера, штатных специалистов для наблюдения за сложными средами и governance, чтобы контролировать расползание инфраструктуры и сервисов. Проектирование с учетом отказов теперь стало стандартной статьей расходов, а не исключением, которого можно избежать. Это серьезный сдвиг, и компаниям следует относиться к нему именно так.

Скорее всего, cloud-провайдеры и дальше будут агрессивно наращивать выручку от ИИ. Компании продолжат покупать, потому что альтернатива медленнее, сложнее и часто политически трудна внутри организации. Но рост выручки провайдеров будет достигаться за счет корпоративных клиентов, которые могут слишком поздно обнаружить, что дорогая ИИ-операционная модель сокращает число ИИ-ставок, которые они вообще могут себе позволить.

Более разумный путь вперед

Вместо анти-cloud стратегии компаниям нужна selective cloud strategy. Используйте public cloud там, где важнее всего скорость, масштаб и доступ к экосистеме. Осознанно решайте, какие ИИ-workload’ы заслуживают этой премии, а какие со временем лучше обслуживать через private cloud, hybrid architecture или более контролируемые on-premises-среды. Сохраняйте optionality. Не считайте первый удобный выбор платформы неизменной архитектурной истиной.

Всегда помните: успех ИИ определяется не тем, как быстро вы запускаете первое решение. Он определяется тем, сколько полезных, устойчивых и экономически рациональных решений вы сможете построить в течение следующих нескольких лет. Public cloud часто выглядит как — и может быть — правильным выбором для ИИ-workload’ов. Однако компании, которые путают удобство с эффективностью, будут финансировать рост cloud-провайдеров, ограничивая при этом собственную способность масштабировать ИИ там, где это важнее всего. Смотрите дальше того дня, когда ИИ-нагрузка впервые выходит в production.


Материал — перевод статьи с английского.

Оригинал: Running AI in the cloud is easy – and expensive