Z.ai представила GLM-5.1 для автономной агентной разработки ПО

by Прашант Аби Томас

Z.ai представила GLM-5.1, позволяющую ИИ-агентам для кодирования автономно работать часами
новости
8 апр. 2026 г. 4 мин.

Китайская компания заявила, что её новая open-source-модель может продолжать улучшаться на протяжении сотен итераций, поскольку поставщики ИИ спешат создавать инструменты, способные справляться с более длительными программными задачами.

Китайская компания Z.ai в области ИИ выпустила GLM-5.1 — open-source-модель для кодирования, которая, по её словам, создана для агентной разработки ПО. Релиз выходит на фоне того, как поставщики ИИ уходят от инструментов автодополнения к системам, способным выполнять программные задачи в течение более длительного времени и с меньшим участием человека.

Z.ai заявила, что GLM-5.1 способна сохранять качество работы на протяжении сотен итераций — это, по мнению компании, отличает её от моделей, которые теряют эффективность в более длинных сессиях.

В качестве примера компания сообщила, что GLM-5.1 улучшила задачу оптимизации векторной базы данных за более чем 600 итераций и 6000 вызовов инструментов, достигнув 21 500 запросов в секунду — примерно в шесть раз лучше результата, достигнутого в одной сессии из 50 раундов.

В исследовательской записке Z.ai заявила, что GLM-5.1 превзошла своего предшественника, GLM-5, по нескольким бенчмаркам в области разработки ПО и показала особую силу в генерации репозиториев, решении задач через терминал и повторной оптимизации кода. Компания сообщила, что модель набрала 58,4 балла в SWE-Bench Pro, по сравнению с 55,1 у GLM-5, и превзошла показатели, которые она указала для GPT-5.4 от OpenAI, Opus 4.6 от Anthropic и Gemini 3.1 Pro от Google в этом бенчмарке.

GLM-5.1 выпущена под лицензией MIT и доступна через платформы для разработчиков; веса модели также опубликованы для локального развёртывания, заявила компания. Это может привлечь компании, ищущие больший контроль над тем, как такие инструменты развёртываются.

Долгоживущие агенты для кодирования

Z.ai считает, что длительная работа без перерыва — ключевое отличие компании по сравнению с моделями, которые теряют эффективность в продолжительных сессиях.

Аналитики говорят, что это связано с тем, что многие современные модели по-прежнему выходят на плато или начинают «дрейфовать» уже после относительно небольшого числа раундов, что ограничивает их полезность при длительных многошаговых задачах разработки ПО.

Парикх Джайн, CEO Pareekh Consulting, сказал, что отрасль сейчас движется от инструментов, которые могут отвечать на запросы, к системам, способным выполнять более длительные поручения с меньшим контролем со стороны человека.

Вопрос, по словам Джайна, уже не в том: «Что я могу спросить у этого ИИ?», а в том: «Что я могу поручить ему на следующие восемь часов?»

Для предприятий это означает возможность выдать агенту задачу утром и получить к концу дня оптимизированное решение после сотен экспериментов и профилирования кода.

«Эта возможность соответствует реальным потребностям, таким как крупные рефакторинги, миграционные программы и непрерывное устранение инцидентов», — сказал Чарли Дай, вице-президент и главный аналитик Forrester. «Это говорит о том, что долгоживущие автономные агенты становятся более практичными, при условии что предприятия выстраивают механизмы управления, мониторинга и эскалации для управления рисками».

Растёт привлекательность open-source

Выпуск GLM-5.1 под лицензией MIT может иметь большое значение, особенно для компаний в регулируемых или чувствительных к безопасности секторах.

«Это важно по четырём ключевым причинам», — сказал Джайн. «Во-первых, стоимость. Цены значительно ниже, чем у премиальных моделей, а собственный хостинг позволяет компаниям контролировать расходы вместо оплаты за использование. Во-вторых, управление данными. Конфиденциальный код и данные не нужно отправлять во внешние API, что критически важно в таких секторах, как финансы, здравоохранение и оборона. В-третьих, настройка под себя. Компании могут адаптировать модель к своим кодовым базам и внутренним инструментам без ограничений».

Четвёртый фактор, по словам Джайна, — геополитический риск. Хотя модель является open source, её связи с китайской инфраструктурой и организациями всё равно могут вызывать вопросы по комплаенсу у некоторых американских компаний.

Дай сказал, что лицензия MIT облегчает компаниям запуск модели на собственных системах с адаптацией под внутренние требования и политики управления. «Для многих покупателей это делает GLM‑5.1 жизнеспособным стратегическим вариантом наряду с коммерческими моделями, особенно там, где наиболее важны регуляторные ограничения, чувствительность к ИС или долгосрочный контроль над платформой», — сказал Дай.

Достоверность бенчмарков

Z.ai сослалась на три бенчмарка: SWE-Bench Pro, который тестирует сложные задачи программной инженерии; NL2Repo, который измеряет генерацию репозиториев; и Terminal-Bench 2.0, который оценивает реальное решение задач через терминал.

«Эти бенчмарки созданы для проверки продвинутых возможностей кодирующих агентов, поэтому лидирующие позиции в них отражают сильную производительность в кодировании, например надёжность при переходе от планирования к выполнению, меньше доработок по подсказкам и более быструю доставку», — сказал Лиан Джие Су, главный аналитик Omdia. «Однако они по-прежнему оторваны от типичных реалий предприятий».

Су сказал, что публичные бенчмарки всё ещё не отражают всей сложности проприетарных кодовых баз, устаревших систем и рабочих процессов code review. Он добавил, что результаты бенчмарков получены в контролируемых условиях, отличающихся от производственной среды, хотя разрыв сокращается по мере того, как всё больше команд внедряют агентные схемы.

Оригинал статьи был опубликован в ComputerWorld.

Искусственный интеллект Инструменты разработки Разработка ПО Open Source

by
Прашант Аби Томас

Прашант Аби Томас — внештатный технологический журналист, специализирующийся на полупроводниках, безопасности, ИИ и электромобилях. Его работы публиковались, среди прочего, в DigiTimes Asia и asmag.com.

В начале своей карьеры Прашант был корреспондентом Reuters, освещавшим энергетический сектор. До этого он был корреспондентом International Business Times UK, освещавшим азиатские и европейские рынки и макроэкономические события.

Он имеет степень магистра международной журналистики Бурнмутского университета, степень магистра визуальных коммуникаций колледжа Лойола, степень бакалавра английского языка Университета Махатмы Ганди и изучал китайский язык в Национальном тайваньском университете.

Ещё от этого автора

Показать ещё

новости

Оригинал: Z.ai unveils GLM-5.1, enabling AI coding agents to run autonomously for hours

Подписаться на новости в Telegram

ИИ для бизнеса

Z.ai представила GLM-5.1 для автономной агентной разработки ПО

Долгоживущие агенты для кодирования

Растёт привлекательность open-source

Достоверность бенчмарков

Ещё от этого автора

Kilo нацелена на теневых ИИ-агентов с управляемой корпоративной платформой

Meta показывает, что структурированные промпты могут сделать LLM более надёжными для code review

Google нацеливается на узкие места ИИ-инференса с TurboQuant

Cloudflare запускает Dynamic Workers для выполнения ИИ-агентов

Nvidia запускает Nemotron 3 Super для поддержки корпоративных ИИ-агентов

OpenAI разрабатывает конкурента GitHub на фоне усиления гонки ИИ-платформ для кодирования

Техника multi-token prediction утроила скорость инференса LLM без вспомогательных draft-моделей

Mistral AI усиливает амбиции в вычислениях с приобретением Koyeb

Показать ещё

Z.ai представила GLM-5.1, позволяющую ИИ-агентам для кодирования автономно работать часами

Начните работать с новым типом frozendict в Python

Проблема масштабирования Terraform: когда инфраструктура как код становится инфраструктурой как сложностью

Новый тип frozendict в Python

Как повысить производительность приложения с помощью ленивого импорта Python 3.15

Как запустить свой маленький локальный Claude Code (ну, почти!)