Alibaba строит AI-чипы для агентов: Zhenwu M890, дорожная карта до 2028 года и Qwen 3.7-Max — ИИ для бизнеса

Alibaba строит AI-чипы для агентов: Zhenwu M890, дорожная карта до 2028 года и Qwen 3.7-Max

Прослушать статью

Alibaba представила новый AI-процессор, созданный специально для AI-агентов, и одновременно показала многолетнюю дорожную карту развития кремниевой базы, а также новую большую языковую модель. Это сигнализирует, что компания выстраивает интегрированный AI-стек, а не просто закрывает дефицит, возникший из-за экспортных ограничений США.

Разработанный полупроводниковой дочерней структурой Alibaba T-Head чип Zhenwu M890, по данным компании, обеспечивает в три раза более высокую производительность, чем его предшественник Zhenwu 810E, как сообщает Reuters. Но важнее самого прироста производительности архитектурный замысел: M890 изначально спроектирован для AI-агентов, где программным системам нужно сохранять длинные отрезки контекста, координироваться с другими моделями в реальном времени и выполнять сложные многошаговые задачи при ограниченном участии человека.

Такие требования, связанные с высокой потребностью в пропускной способности памяти и межмодельной коммуникации, заметно отличаются от того, под что оптимизированы стандартные чипы для инференса. Это различие важно, потому что оно показывает, как Alibaba видит будущее AI-вычислений. Компания проектирует не под доминирующий сегодня сценарий использования, а под профиль нагрузки, который, по ее ожиданиям, будет определять enterprise AI в ближайшие несколько лет.

Создан для AI-агентов, а не только для инференса

Еще значимее самого чипа оказалась дорожная карта, которую Alibaba представила вместе с ним. За M890 последует V900 в третьем квартале 2027 года, который, как ожидается, даст еще примерно трехкратный рост производительности, а затем J900 в третьем квартале 2028 года. Это намеренный и устойчивый ритм обновления собственных кремниевых решений, напоминающий tick-tock-циклы продуктов, которые Nvidia использовала для сохранения лидерства в области AI-ускорителей.

Параллель с Huawei здесь особенно показательна. В прошлом году Huawei представила похожую дорожную карту для линейки Ascend, и оба анонса отражают одну и ту же реальность: китайские технологические компании пришли к выводу, что зависимость от иностранного кремния, даже если экспортные ограничения когда-нибудь смягчатся, остается структурным риском, с которым они не готовы мириться. Ответом стало отношение к разработке полупроводников как к долгосрочному наращиванию собственных возможностей, а не как к задаче закупок.

Приверженность Alibaba этому курсу не ограничивается словами. В прошлом году компания пообещала направить более 380 млрд юаней, примерно US$53 млрд, на облачную и AI-инфраструктуру в течение трех лет — это крупнейшее инвестиционное обязательство в истории компании в этом сегменте. M890 и его преемники являются следствием этих расходов.

Тяга, которая появилась до анонса

В T-Head сообщили, что на текущий момент отгружено более 560 000 единиц Zhenwu, а более 400 внешних клиентов в 20 отраслях уже используют эти чипы, включая автопроизводителей и компании финансового сектора. Это уже заметный производственный масштаб, а не лабораторное железо, и он дает Alibaba реальные данные о внедрении в реальных условиях еще до запуска M890.

Новый чип станет доступен китайским корпоративным клиентам через внутреннюю модельную платформу Alibaba Cloud Bailian в составе Panjiu AL128 — серверной системы, которая объединяет 128 ускорителей M890 в одной стойке.

Программная часть стека

Параллельно с аппаратной частью Alibaba представила Qwen 3.7-Max — новейшую версию своей флагманской большой языковой модели, которую компания описывает как решение, созданное для продвинутого программирования и длительных agent-задач. Компания заявила, что модель может непрерывно работать до 35 часов без ухудшения производительности, и такая характеристика имеет смысл только в том случае, если система проектируется для продолжительной автономной работы.

Выбор времени не случаен. Выпустить в один день чип и модель, оптимизированные под один и тот же класс задач, — это платформа, а не просто набор новостей. Alibaba строит замкнутый контур: собственный кремний в T-Head, собственная модель в Qwen, собственная облачная доставка через Bailian. Каждый компонент усиливает остальные, а весь стек в целом призван снизить зависимость корпоративных клиентов от внешних поставщиков.

Полмиллиона чипов уже отгружено. Преемник появится в 2027 году, еще один — в 2028-м. T-Head не действует наугад. В какой-то момент строительство вокруг экспортных ограничений США перестает быть временным обходным маневром и становится стратегией. Похоже, Alibaba перешла именно к этому этапу.

(Источник изображения: The White House)

См. также: Alibaba Qwen бросает вызов экономике закрытых AI-моделей

Хотите узнать больше об AI и big data от лидеров отрасли? Посетите AI & Big Data Expo, которая пройдет в Амстердаме, Калифорнии и Лондоне. Мероприятие входит в состав TechEx и проводится совместно с другими ведущими технологическими событиями. Здесь — дополнительная информация.

AI News поддерживается TechForge Media. Узнать о других предстоящих корпоративных технологических мероприятиях и вебинарах можно здесь.


Материал — перевод статьи с английского.

Оригинал: Alibaba is designing AI chips around agents, and that changes what the race is actually about