Z.ai представила GLM-5.1, позволяющую ИИ-агентам для кодирования автономно работать часами
новости
8 апр. 2026 г. 4 мин.
Китайская компания заявила, что её новая open-source-модель может продолжать улучшаться на протяжении сотен итераций, поскольку поставщики ИИ спешат создавать инструменты, способные справляться с более длительными программными задачами.
Источник: Shutterstock / kung_tom
Китайская компания Z.ai в области ИИ выпустила GLM-5.1 — open-source-модель для кодирования, которая, по её словам, создана для агентной разработки ПО. Релиз выходит на фоне того, как поставщики ИИ уходят от инструментов автодополнения к системам, способным выполнять программные задачи в течение более длительного времени и с меньшим участием человека.
Z.ai заявила, что GLM-5.1 способна сохранять качество работы на протяжении сотен итераций — это, по мнению компании, отличает её от моделей, которые теряют эффективность в более длинных сессиях.
В качестве примера компания сообщила, что GLM-5.1 улучшила задачу оптимизации векторной базы данных за более чем 600 итераций и 6000 вызовов инструментов, достигнув 21 500 запросов в секунду — примерно в шесть раз лучше результата, достигнутого в одной сессии из 50 раундов.
В исследовательской записке Z.ai заявила, что GLM-5.1 превзошла своего предшественника, GLM-5, по нескольким бенчмаркам в области разработки ПО и показала особую силу в генерации репозиториев, решении задач через терминал и повторной оптимизации кода. Компания сообщила, что модель набрала 58,4 балла в SWE-Bench Pro, по сравнению с 55,1 у GLM-5, и превзошла показатели, которые она указала для GPT-5.4 от OpenAI, Opus 4.6 от Anthropic и Gemini 3.1 Pro от Google в этом бенчмарке.
GLM-5.1 выпущена под лицензией MIT и доступна через платформы для разработчиков; веса модели также опубликованы для локального развёртывания, заявила компания. Это может привлечь компании, ищущие больший контроль над тем, как такие инструменты развёртываются.
Долгоживущие агенты для кодирования
Z.ai считает, что длительная работа без перерыва — ключевое отличие компании по сравнению с моделями, которые теряют эффективность в продолжительных сессиях.
Аналитики говорят, что это связано с тем, что многие современные модели по-прежнему выходят на плато или начинают «дрейфовать» уже после относительно небольшого числа раундов, что ограничивает их полезность при длительных многошаговых задачах разработки ПО.
Парикх Джайн, CEO Pareekh Consulting, сказал, что отрасль сейчас движется от инструментов, которые могут отвечать на запросы, к системам, способным выполнять более длительные поручения с меньшим контролем со стороны человека.
Вопрос, по словам Джайна, уже не в том: «Что я могу спросить у этого ИИ?», а в том: «Что я могу поручить ему на следующие восемь часов?»
Для предприятий это означает возможность выдать агенту задачу утром и получить к концу дня оптимизированное решение после сотен экспериментов и профилирования кода.
«Эта возможность соответствует реальным потребностям, таким как крупные рефакторинги, миграционные программы и непрерывное устранение инцидентов», — сказал Чарли Дай, вице-президент и главный аналитик Forrester. «Это говорит о том, что долгоживущие автономные агенты становятся более практичными, при условии что предприятия выстраивают механизмы управления, мониторинга и эскалации для управления рисками».
Растёт привлекательность open-source
Выпуск GLM-5.1 под лицензией MIT может иметь большое значение, особенно для компаний в регулируемых или чувствительных к безопасности секторах.
«Это важно по четырём ключевым причинам», — сказал Джайн. «Во-первых, стоимость. Цены значительно ниже, чем у премиальных моделей, а собственный хостинг позволяет компаниям контролировать расходы вместо оплаты за использование. Во-вторых, управление данными. Конфиденциальный код и данные не нужно отправлять во внешние API, что критически важно в таких секторах, как финансы, здравоохранение и оборона. В-третьих, настройка под себя. Компании могут адаптировать модель к своим кодовым базам и внутренним инструментам без ограничений».
Четвёртый фактор, по словам Джайна, — геополитический риск. Хотя модель является open source, её связи с китайской инфраструктурой и организациями всё равно могут вызывать вопросы по комплаенсу у некоторых американских компаний.
Дай сказал, что лицензия MIT облегчает компаниям запуск модели на собственных системах с адаптацией под внутренние требования и политики управления. «Для многих покупателей это делает GLM‑5.1 жизнеспособным стратегическим вариантом наряду с коммерческими моделями, особенно там, где наиболее важны регуляторные ограничения, чувствительность к ИС или долгосрочный контроль над платформой», — сказал Дай.
Достоверность бенчмарков
Z.ai сослалась на три бенчмарка: SWE-Bench Pro, который тестирует сложные задачи программной инженерии; NL2Repo, который измеряет генерацию репозиториев; и Terminal-Bench 2.0, который оценивает реальное решение задач через терминал.
«Эти бенчмарки созданы для проверки продвинутых возможностей кодирующих агентов, поэтому лидирующие позиции в них отражают сильную производительность в кодировании, например надёжность при переходе от планирования к выполнению, меньше доработок по подсказкам и более быструю доставку», — сказал Лиан Джие Су, главный аналитик Omdia. «Однако они по-прежнему оторваны от типичных реалий предприятий».
Су сказал, что публичные бенчмарки всё ещё не отражают всей сложности проприетарных кодовых баз, устаревших систем и рабочих процессов code review. Он добавил, что результаты бенчмарков получены в контролируемых условиях, отличающихся от производственной среды, хотя разрыв сокращается по мере того, как всё больше команд внедряют агентные схемы.
Оригинал статьи был опубликован в ComputerWorld.
Искусственный интеллектИнструменты разработкиРазработка ПОOpen Source
Прашант Аби Томас — внештатный технологический журналист, специализирующийся на полупроводниках, безопасности, ИИ и электромобилях. Его работы публиковались, среди прочего, в DigiTimes Asia и asmag.com.
В начале своей карьеры Прашант был корреспондентом Reuters, освещавшим энергетический сектор. До этого он был корреспондентом International Business Times UK, освещавшим азиатские и европейские рынки и макроэкономические события.
Он имеет степень магистра международной журналистики Бурнмутского университета, степень магистра визуальных коммуникаций колледжа Лойола, степень бакалавра английского языка Университета Махатмы Ганди и изучал китайский язык в Национальном тайваньском университете.
Ещё от этого автора
Показать ещё
новости
Z.ai представила GLM-5.1, позволяющую ИИ-агентам для кодирования автономно работать часами
Автор: Прашант Аби Томас8 апр. 20264 мин.
Искусственный интеллектИнструменты разработкиOpen Source

feature
Начните работать с новым типом frozendict в Python
Автор: Сердар Егулап8 апр. 20265 мин.
Языки программированияPythonРазработка ПО

opinion
Проблема масштабирования Terraform: когда инфраструктура как код становится инфраструктурой как сложностью
Автор: Нил Шах7 апр. 202614 мин.
Управление облакомИнструменты разработкиDevops

video
Новый тип frozendict в Python
video
Как повысить производительность приложения с помощью ленивого импорта Python 3.15
video
Как запустить свой маленький локальный Claude Code (ну, почти!)
26 мар. 20267 мин.
Python
![]()
Материал — перевод статьи с английского.
Оригинал: Z.ai unveils GLM-5.1, enabling AI coding agents to run autonomously for hours