Почему open-weight модели набирают популярность на фоне LLM
Хотя LLM по-прежнему популярны, ИТ-руководители все чаще тестируют более компактные open-weight модели, которые могут лучше подходить для корпоративных задач ИИ.
Хотя проприетарные ИИ-модели, такие как ChatGPT от OpenAI и Google Gemini, по-прежнему остаются популярными, ситуация может меняться: ИТ-руководители все чаще смотрят в сторону открытых моделей, стремясь настраивать ИИ под свои задачи и снижать затраты.
Альтернативы large language models (LLMs), которые иногда называют моделями с открытыми весами, могут дать руководителям больше прозрачности и контроля над внутренним использованием ИИ, чего закрытые модели не обеспечивают, считают аналитики. Они также помогают ИТ-лидерам управлять экономикой и governance ИИ внутри организаций.
«Это почти как будто перед вами уже есть чистые холсты, и вы можете рисовать на них что хотите», — сказал Deepak Seth, старший аналитик Gartner. «Вам не нужно делать сам холст. То есть вы не начинаете с нуля, даже когда строите собственную модель».
Open models можно бесплатно скачать и использовать. Пользователи могут донастраивать и разворачивать их под свои требования, примерно так же, как Linux доступен каждому для загрузки, настройки и использования.
Open models набирают обороты, потому что для них появляется все больше сценариев применения, сказал Jesse Williams, сооснователь и COO компании Jozu, которая занимается инструментами для ИИ. «Open source более гибок и может использоваться так, как проприетарные модели… в некоторых случаях нельзя доверить работу», — сказал Williams.
«Проприетарные модели растут в использовании и популярности быстрее, чем любая технология, которую мы когда-либо видели, и не демонстрируют признаков замедления», — отметил он, подчеркнув, что растущую популярность open models не стоит воспринимать просто как реакцию против LLM.
Среди популярных open models — Llama от Meta, Mistral, DeepSeek и Minimax. Поставщики проприетарного генеративного ИИ также выпустили open source-версии своих LLM: Gemma от Google — ответвление Gemini, у OpenAI есть GPT-OSS, а у Microsoft — Phi.
Хотя модели можно донастраивать под конкретные корпоративные потребности, они не раскрывают источники данных, на которых были обучены.
По сравнению с проприетарными LLM, open models от Google и OpenAI обучаются на меньших объемах данных и могут быть не столь умными, сказал Max Leaming, руководитель направления data science и AI solutions в ManpowerGroup. Поэтому open models требуют экспериментов, чтобы найти подходящий сценарий применения. «Для чего эта модель хороша? — сказал он. — Это нужно выяснить. Ни одна из них не является по-настоящему универсальной моделью».
Компании, включая ServiceNow, Microsoft, HubSpot и RWS, утверждают, что open models легче встроить в AI-инфраструктуру, они снижают вычислительные затраты и лучше подходят для agentic AI workflows.
Недавние сбои у поставщиков закрытых моделей, таких как Anthropic и OpenAI, тоже заставляют CIO задумываться о vendor lock-in и о необходимости добавлять open models, чтобы повысить устойчивость ИИ, сказал Max Goss, старший директор по исследованиям Gartner. «AI-гонка все еще находится на ранней стадии», — сказал он, добавив: «CIO должны помнить, для чего они задействуют ИИ, и что является альтернативой, каков план B?»
Open models часто хорошо подходят для on-premise deployment благодаря более низкой стоимости и лучшей безопасности. «Я также не передаю наши данные провайдеру, который может использовать эти данные, чтобы… буквально обучать модели для наших конкурентов», — сказал Leaming из ManpowerGroup.
Модели можно использовать и в робототехнике, где они дают роботам универсальный язык для общения, по словам Rev Lebaredian, вице-президента по физической симуляции ИИ в Nvidia. Он выступал на пресс-брифинге перед выставкой GTC компании earlier this year.
Стек Nvidia для робототехники на базе ИИ в значительной степени является open source, что позволяет «связать всю робототехническую экосистему воедино», сказал Lebaredian.
Open models также играют роль в стремлении к цифровому суверенитету в Европе и других регионах. Например, Франция делает ставку в своей стратегии sovereign AI на Mistral, а у ОАЭ есть K2 Think V2, разработанная Mohamed bin Zayed University of Artificial Intelligence, G42 и компанией Cerebras Systems.
Open models важны для sovereign AI, чтобы страны могли понимать, адаптировать и контролировать системы, на которых работает цифровая инфраструктура, сказал Richard Morton, вице-президент и управляющий директор Institute of Foundation Models в MBZUAI.
K2 Think V2 от MBZUAI дает странам возможность строить ИИ, согласованный с их собственными приоритетами, языками, ценностями и требованиями безопасности. «Для нас суверенитет в конечном счете означает осмысленное владение самой технологией», — сказал Morton.
Несмотря на растущий интерес, open models несут и определенные риски безопасности. Злоумышленники могут, например, взламывать системы с помощью вредоносных промптов или использовать ИИ-технологию для атак, говорится в исследовании, опубликованном Министерством науки, инноваций и технологий Великобритании и AI Security Institute.
Модели с уязвимостями могут стать точкой входа для хакеров в корпоративные системы, говорится в исследовании, которое возглавил Yoshua Bengio, пионер deep learning. «В отличие от закрытых моделей, где хосты могут универсально выкатывать исправления, разработчики open-weight моделей не могут гарантировать, что пользователи установят обновления», — говорится в исследовании.
Материал — перевод статьи с английского.