Покупка Nvidia компании SchedMD усилила вопросы о нейтральности Slurm для AI-кластеров

by Гьяна Суэйн

Поглощение SchedMD компанией Nvidia ставит открытое ИИ-планирование под пристальное внимание
новости
7 апр. 20265 мин

Теперь, когда Nvidia контролирует дорожную карту Slurm, предприятия, использующие кластеры GPU от разных производителей, задаются вопросом, достаточно ли гарантий open source.

Jensen Huang Nvidia's Founder, President and CEO gestures during a News event

Фото: Shutterstock

Недавнее приобретение компанией Nvidia SchedMD, компании, стоящей за менеджером рабочих нагрузок Slurm, вызывает обеспокоенность у руководителей ИИ-индустрии и специалистов по суперкомпьютерам, которые опасаются, что чиповый гигант может использовать свое новое положение, чтобы отдавать предпочтение собственному оборудованию перед конкурентными чипами — будь то через приоритизацию кода или решения по дорожной карте.

Как это формулируют отраслевые источники, суть опасений проста: теперь Nvidia контролирует программное обеспечение для планирования, которое также работает на оборудовании ее конкурентов, включая AMD и Intel. Поставщик, контролирующий ПО для планирования рабочих нагрузок, получает значительное влияние на то, насколько эффективно конкурирующее оборудование работает в общих вычислительных средах — использует ли он это влияние или нет, сообщило Reuters, ссылаясь на пять анонимных источников, трое из которых работают в индустрии ИИ, а двое знакомы с эксплуатацией суперкомпьютеров.

Аналитики, с которыми поговорил InfoWorld, сказали, что приверженность Nvidia open source — компания заявила во время объявления о покупке, что будет «и дальше разрабатывать и распространять Slurm как open-source, vendor-neutral software» — может оказаться недостаточной защитой.

«Открытая основа Slurm обеспечивает такие гарантии, как прозрачный код, возможность форка и управление сообществом, но контроль со стороны SchedMD дает Nvidia мягкую власть, а не жесткую привязку», — сказал Маниш Рават, аналитик по полупроводникам в TechInsights. По словам Равата, Nvidia может тонко формировать дорожную карту, делая упор на GPU-aware scheduling и оптимизацию топологии, выгодные ее собственному оборудованию, а также сроки интеграции уже показывают более быструю поддержку экосистемы CUDA по сравнению с альтернативами вроде ROCm от AMD или oneAPI от Intel — создавая то, что он назвал «эффектом наиболее поддерживаемого пути».

Что такое Slurm и почему это важно

Slurm, изначально разработанный в Lawrence Livermore National Laboratory, работает примерно на 60% суперкомпьютеров мира. Это ПО активно используется крупными компаниями в сфере ИИ, включая Meta Platforms, французский ИИ-стартап Mistral и Anthropic, для некоторых этапов обучения моделей ИИ, сообщило Reuters.

Государственные суперкомпьютеры, используемые для прогнозирования погоды и исследований в области национальной безопасности, также зависят от него. Nvidia приобрела разработчика Slurm SchedMD в декабре 2025 года и описала сделку как шаг к укреплению своей экосистемы open source и помощи пользователям в освоении новых ИИ-техник наряду с традиционной работой в суперкомпьютинге.

Обоснованы ли опасения?

Доктор Дэниш Фаруки, CEO Fab Economics, американской консалтинговой компании по ИИ-оборудованию и дата-центрам, сказал, что риск реален.

«Скептицизм относительно того, что Nvidia может отдавать приоритет своему собственному оборудованию в будущих обновлениях ПО, потенциально задерживая или неоптимально поддерживая конкурентов, — это вполне возможный исход», — сказал он. Как основной разработчик, Nvidia теперь контролирует официальный план разработки Slurm и процесс проверки кода, сказал Фаруки, «что может влиять на то, насколько быстро конкурирующие чипы интегрируются в новые элементы разработки или постоянного улучшения».

Владение управляющим уровнем наряду с GPU и сетевой инфраструктурой, такой как InfiniBand, добавил он, позволяет Nvidia создать тесно вертикально интегрированный стек, который может привести к тому, что он назвал «неглубокими рвами, где продвинутые функции доступны или работают эффективно только на оборудовании Nvidia».

По мнению отраслевых наблюдателей, одним из наглядных тестов станет то, насколько быстро Nvidia интегрирует поддержку чипов AMD следующего поколения в кодовую базу Slurm по сравнению с тем, как быстро она интегрирует свое собственное предстоящее оборудование и сетевые технологии, такие как InfiniBand.

Справедлива ли прецедентная аналогия с Bright Computing?

Аналитики указывают на приобретение Nvidia компании Bright Computing в 2022 году как на отправную точку, утверждая, что ПО было оптимизировано под чипы Nvidia таким образом, что это ставило в невыгодное положение пользователей конкурирующего оборудования. Nvidia оспаривала эту характеристику, заявляя, что Bright Computing поддерживает «почти любой кластер на CPU или GPU».

Рават сказал, что сравнение поучительное, но неидеальное. «Приобретение Bright Computing компанией Nvidia подчеркивает ее предпочтение вертикальной интеграции, тесно встраивая Bright в стеки DGX и AI Factory вместо сохранения нейтральной, мультивендорной роли оркестрации», — сказал он. «Это отражает более широкий стратегический паттерн — Nvidia стремится контролировать весь опыт AI-инфраструктуры».

Однако, по его словам, Slurm представляет принципиально иную проблему. «Глубоко укорененный в суперкомпьютерных центрах и академической среде, а по сути управляемый сообществом, Slurm связан с высокими издержками перехода», — сказал Рават. «Nvidia может влиять, но вряд ли сможет повторить такой же тесно интегрированный контроль на рынках, где доминируют устоявшиеся, нейтральные и движимые сообществом платформы».

Защитный клапан open source и его ограничения

Фаруки признал, что open source-лицензирование Slurm по лицензии GNU GPL v2.0 предлагает некоторую защиту, включая право сообщества создать форк проекта, если руководство Nvidia будет воспринято как предвзятое. Но он предупредил, что у такого варианта есть и собственные риски. «Статус Slurm как open-source предоставляет предохранительный клапан со своими ограничениями, но это не является полной защитой от нарушения vendor neutrality», — сказал он.

Приобретение привело к тому, что многие ведущие разработчики Slurm в мире оказались внутри Nvidia, отметил он, а значит, форку, созданному сообществом, будет трудно поддерживать тот же темп развития.

Рават описал ситуацию как «стратегический риск зависимости, а не кризис» и сказал, что организациям следует диверсифицировать закупки GPU, тестировать рабочие нагрузки в нескольких экосистемах вендоров и развивать внутреннюю экспертизу, чтобы при необходимости модифицировать инструменты оркестрации или переходить на другие.

Фаруки рекомендовал корпоративным покупателям, ведущим переговоры о соглашениях по поддержке Slurm, добиваться гарантий уровня сервиса, одинаково применимых к оборудованию не-Nvidia, включая сроки отклика, исправления ошибок и паритет функций во всех гетерогенных кластерах. Что касается архитектуры, он сказал, что организациям следует рассмотреть контейнеризацию ИИ-нагрузок, чтобы изолировать приложения от базового планировщика, делая миграцию на альтернативные планировщики, такие как Flux или Kubernetes, более осуществимой при необходимости.

Изначально статья была опубликована в InfoWorld.

Технологическая индустрияИскусственный интеллект

ПОДПИШИТЕСЬ НА НАШУ РАССЫЛКУ

Начните, введя свой адрес электронной почты ниже.

by
Гьяна Суэйн

Гьяна Суэйн — опытный технологический журналист с более чем 20-летним опытом освещения телеком- и ИТ-сферы. Он — консультирующий редактор VARINDIA; ранее в своей карьере занимал редакторские должности в CyberMedia, PTI, 9dot9 Media и Dennis Publishing. Автор двух опубликованных книг, он сочетает отраслевую экспертизу с глубиной повествования. Вне работы он заядлый путешественник и любитель крикета. Он получил степень B.S. в Университете Уткала.

Еще от этого автора

Покажите мне еще

новости

Поглощение SchedMD компанией Nvidia ставит open-source ИИ-планирование под пристальное внимание

Автор Gyana Swain7 апр. 20265 мин
Искусственный интеллектТехнологическая индустрия
Image

новости анализ

Mac от Apple захватывает 11% рынка корпоративных ПК

Автор Jonny Evans7 апр. 20265 мин
AppleКомпьютеры и периферияMac
Image

how-to

8 продвинутых способов, которыми Vivaldi повышает вашу продуктивность

Автор JR Raphael7 апр. 202615 мин
БраузерыПрограммное обеспечение для продуктивности
Image

podcast

Claude Automation, Windows 11 Overhaul, Sora Shutdown Shift | Ep. 66

Автор Arnold Davick2 апр. 20262 мин
Искусственный интеллект
Image

podcast

OpenAI Hiring Surge, FCC Router Ban, Cloudflare Workers | Ep. 65

Автор Arnold Davick1 апр. 20262 мин
Искусственный интеллект
Image

podcast

Amazon AI Smartphone, Chip Shortage, Anthropic Lawsuit Updates | Ep. 63

Автор Arnold Davick26 мар. 20262 мин
Искусственный интеллект
Image

video

Claude Automation, Windows 11 Overhaul, Sora Shutdown Shift | Ep. 66

Автор Arnold Davick2 апр. 20262 мин
Искусственный интеллект
Image

video

OpenAI Hiring Surge, FCC Router Ban, Cloudflare Workers | Ep. 65

Автор Arnold Davick1 апр. 20262 мин
Искусственный интеллект
Image

video

How Pittsburgh Airport modernized its IT for smarter operations

31 мар. 202639 мин
Искусственный интеллектЦифровая трансформацияWi‑Fi
Image


Материал — перевод статьи с английского.

Оригинал: Nvidia’s SchedMD acquisition puts open-source AI scheduling under scrutiny