Z.ai представила GLM-5.1 для автономной агентной разработки ПО

by Прашант Аби Томас

Z.ai представила GLM-5.1, позволяющую ИИ-агентам для кодирования автономно работать часами
новости
8 апр. 2026 г. 4 мин.

Китайская компания заявила, что её новая open-source-модель может продолжать улучшаться на протяжении сотен итераций, поскольку поставщики ИИ спешат создавать инструменты, способные справляться с более длительными программными задачами.

Источник: Shutterstock / kung_tom

Китайская компания Z.ai в области ИИ выпустила GLM-5.1 — open-source-модель для кодирования, которая, по её словам, создана для агентной разработки ПО. Релиз выходит на фоне того, как поставщики ИИ уходят от инструментов автодополнения к системам, способным выполнять программные задачи в течение более длительного времени и с меньшим участием человека.

Z.ai заявила, что GLM-5.1 способна сохранять качество работы на протяжении сотен итераций — это, по мнению компании, отличает её от моделей, которые теряют эффективность в более длинных сессиях.

В качестве примера компания сообщила, что GLM-5.1 улучшила задачу оптимизации векторной базы данных за более чем 600 итераций и 6000 вызовов инструментов, достигнув 21 500 запросов в секунду — примерно в шесть раз лучше результата, достигнутого в одной сессии из 50 раундов.

В исследовательской записке Z.ai заявила, что GLM-5.1 превзошла своего предшественника, GLM-5, по нескольким бенчмаркам в области разработки ПО и показала особую силу в генерации репозиториев, решении задач через терминал и повторной оптимизации кода. Компания сообщила, что модель набрала 58,4 балла в SWE-Bench Pro, по сравнению с 55,1 у GLM-5, и превзошла показатели, которые она указала для GPT-5.4 от OpenAI, Opus 4.6 от Anthropic и Gemini 3.1 Pro от Google в этом бенчмарке.

GLM-5.1 выпущена под лицензией MIT и доступна через платформы для разработчиков; веса модели также опубликованы для локального развёртывания, заявила компания. Это может привлечь компании, ищущие больший контроль над тем, как такие инструменты развёртываются.

Долгоживущие агенты для кодирования

Z.ai считает, что длительная работа без перерыва — ключевое отличие компании по сравнению с моделями, которые теряют эффективность в продолжительных сессиях.

Аналитики говорят, что это связано с тем, что многие современные модели по-прежнему выходят на плато или начинают «дрейфовать» уже после относительно небольшого числа раундов, что ограничивает их полезность при длительных многошаговых задачах разработки ПО.

Парикх Джайн, CEO Pareekh Consulting, сказал, что отрасль сейчас движется от инструментов, которые могут отвечать на запросы, к системам, способным выполнять более длительные поручения с меньшим контролем со стороны человека.

Вопрос, по словам Джайна, уже не в том: «Что я могу спросить у этого ИИ?», а в том: «Что я могу поручить ему на следующие восемь часов?»

Для предприятий это означает возможность выдать агенту задачу утром и получить к концу дня оптимизированное решение после сотен экспериментов и профилирования кода.

«Эта возможность соответствует реальным потребностям, таким как крупные рефакторинги, миграционные программы и непрерывное устранение инцидентов», — сказал Чарли Дай, вице-президент и главный аналитик Forrester. «Это говорит о том, что долгоживущие автономные агенты становятся более практичными, при условии что предприятия выстраивают механизмы управления, мониторинга и эскалации для управления рисками».

Растёт привлекательность open-source

Выпуск GLM-5.1 под лицензией MIT может иметь большое значение, особенно для компаний в регулируемых или чувствительных к безопасности секторах.

«Это важно по четырём ключевым причинам», — сказал Джайн. «Во-первых, стоимость. Цены значительно ниже, чем у премиальных моделей, а собственный хостинг позволяет компаниям контролировать расходы вместо оплаты за использование. Во-вторых, управление данными. Конфиденциальный код и данные не нужно отправлять во внешние API, что критически важно в таких секторах, как финансы, здравоохранение и оборона. В-третьих, настройка под себя. Компании могут адаптировать модель к своим кодовым базам и внутренним инструментам без ограничений».

Четвёртый фактор, по словам Джайна, — геополитический риск. Хотя модель является open source, её связи с китайской инфраструктурой и организациями всё равно могут вызывать вопросы по комплаенсу у некоторых американских компаний.

Дай сказал, что лицензия MIT облегчает компаниям запуск модели на собственных системах с адаптацией под внутренние требования и политики управления. «Для многих покупателей это делает GLM‑5.1 жизнеспособным стратегическим вариантом наряду с коммерческими моделями, особенно там, где наиболее важны регуляторные ограничения, чувствительность к ИС или долгосрочный контроль над платформой», — сказал Дай.

Достоверность бенчмарков

Z.ai сослалась на три бенчмарка: SWE-Bench Pro, который тестирует сложные задачи программной инженерии; NL2Repo, который измеряет генерацию репозиториев; и Terminal-Bench 2.0, который оценивает реальное решение задач через терминал.

«Эти бенчмарки созданы для проверки продвинутых возможностей кодирующих агентов, поэтому лидирующие позиции в них отражают сильную производительность в кодировании, например надёжность при переходе от планирования к выполнению, меньше доработок по подсказкам и более быструю доставку», — сказал Лиан Джие Су, главный аналитик Omdia. «Однако они по-прежнему оторваны от типичных реалий предприятий».

Су сказал, что публичные бенчмарки всё ещё не отражают всей сложности проприетарных кодовых баз, устаревших систем и рабочих процессов code review. Он добавил, что результаты бенчмарков получены в контролируемых условиях, отличающихся от производственной среды, хотя разрыв сокращается по мере того, как всё больше команд внедряют агентные схемы.

Оригинал статьи был опубликован в ComputerWorld.

Искусственный интеллектИнструменты разработкиРазработка ПОOpen Source

by
Прашант Аби Томас

Прашант Аби Томас — внештатный технологический журналист, специализирующийся на полупроводниках, безопасности, ИИ и электромобилях. Его работы публиковались, среди прочего, в DigiTimes Asia и asmag.com.

В начале своей карьеры Прашант был корреспондентом Reuters, освещавшим энергетический сектор. До этого он был корреспондентом International Business Times UK, освещавшим азиатские и европейские рынки и макроэкономические события.

Он имеет степень магистра международной журналистики Бурнмутского университета, степень магистра визуальных коммуникаций колледжа Лойола, степень бакалавра английского языка Университета Махатмы Ганди и изучал китайский язык в Национальном тайваньском университете.

Ещё от этого автора

Показать ещё

новости

Z.ai представила GLM-5.1, позволяющую ИИ-агентам для кодирования автономно работать часами

Автор: Прашант Аби Томас8 апр. 20264 мин.
Искусственный интеллектИнструменты разработкиOpen Source
Image

feature

Начните работать с новым типом frozendict в Python

Автор: Сердар Егулап8 апр. 20265 мин.
Языки программированияPythonРазработка ПО
Image

opinion

Проблема масштабирования Terraform: когда инфраструктура как код становится инфраструктурой как сложностью

Автор: Нил Шах7 апр. 202614 мин.
Управление облакомИнструменты разработкиDevops
Image

video

Новый тип frozendict в Python

2 апр. 20264 мин.
Python
Image

video

Как повысить производительность приложения с помощью ленивого импорта Python 3.15

31 мар. 20266 мин.
Python
Image

video

Как запустить свой маленький локальный Claude Code (ну, почти!)

26 мар. 20267 мин.
Python
Image


Материал — перевод статьи с английского.

Оригинал: Z.ai unveils GLM-5.1, enabling AI coding agents to run autonomously for hours