Глоссарий AI: AGI, AI agent, API endpoints, chain of thought, LLM и другие термины

Прослушать статью

Искусственный интеллект меняет мир и одновременно изобретает для этого совершенно новый язык. Потратьте пять минут на чтение об AI — и вы столкнетесь с LLM, RAG, RLHF и десятком других терминов, которые могут заставить даже очень умных людей в техносреде чувствовать себя неуверенно. Этот глоссарий — наша попытка это исправить. Мы регулярно обновляем его по мере развития отрасли, так что считайте его живым документом, как и сами AI-системы, которые он описывает.

AGI

Artificial general intelligence, или AGI, — это расплывчатый термин. Но в целом он относится к AI, который более способен, чем средний человек, во многих, если не большинстве, задач. Генеральный директор OpenAI Сэм Альтман однажды описал AGI как «эквивалент среднего человека, которого вы могли бы нанять в качестве коллеги». Между тем устав OpenAI определяет AGI как «высокоавтономные системы, которые превосходят людей в большинстве экономически ценной работы». Понимание Google DeepMind немного отличается от этих двух определений: лаборатория рассматривает AGI как «AI, который по крайней мере так же способен, как люди, в большинстве когнитивных задач». Путаетесь? Не переживайте — эксперты на переднем крае исследований AI тоже.

AI agent

AI agent — это инструмент, который использует технологии AI, чтобы выполнять серию задач от вашего имени, выходя за рамки того, что может делать более простой AI-чатбот, например, оформлять расходы, бронировать билеты или столик в ресторане, а также писать и поддерживать код. Однако, как мы объясняли ранее, в этой развивающейся области много подвижных частей, поэтому «AI agent» может означать разные вещи для разных людей. Инфраструктура для реализации его предполагаемых возможностей тоже еще строится. Но базовая идея подразумевает автономную систему, которая может опираться на несколько AI-систем для выполнения многошаговых задач.

API endpoints

Представьте API endpoints как «кнопки» на обратной стороне программного обеспечения, которые другие программы могут нажимать, чтобы заставить его что-то делать. Разработчики используют эти интерфейсы для создания интеграций — например, чтобы одно приложение могло получать данные из другого или чтобы AI agent мог напрямую управлять сторонними сервисами без того, чтобы человек вручную открывал каждый интерфейс. У большинства устройств умного дома и подключенных платформ такие скрытые кнопки есть, даже если обычные пользователи никогда их не видят и не взаимодействуют с ними. По мере того как AI agents становятся все более способными, они все чаще могут находить и использовать эти endpoints самостоятельно, открывая мощные — а иногда и неожиданные — возможности для автоматизации.

Chain of thought

На простой вопрос человеческий мозг может ответить почти не задумываясь — например, на вопрос «какое животное выше, жираф или кошка?». Но во многих случаях вам часто нужна ручка и бумага, чтобы прийти к правильному ответу, потому что есть промежуточные шаги. Например, если у фермера есть куры и коровы, и вместе у них 40 голов и 120 ног, вам, возможно, придется записать простое уравнение, чтобы получить ответ (20 кур и 20 коров).

В контексте AI chain-of-thought reasoning для large language models означает разбиение задачи на более мелкие промежуточные шаги, чтобы повысить качество итогового результата. Обычно на ответ уходит больше времени, но ответ с большей вероятностью будет верным, особенно в контексте логики или кодинга. Reasoning models создаются на основе традиционных large language models и оптимизируются под chain-of-thought thinking благодаря reinforcement learning.

(См.: Large language model)

Techcrunch event

San Francisco, CA|October 13-15, 2026

Coding agents

Это более конкретный вариант понятия AI agent, то есть программы, которая может сама, шаг за шагом, предпринимать действия для достижения цели. Coding agent — это специализированная версия, применяемая в разработке ПО. Вместо того чтобы просто предлагать код, который человек должен проверить и вставить, coding agent может автономно писать, тестировать и отлаживать код, выполняя тот итеративный труд методом проб и ошибок, который обычно занимает день разработчика. Такие агенты могут работать по всему codebase, находить ошибки, запускать тесты и вносить исправления при минимальном человеческом контроле. Это как нанять очень быстрого стажера, который никогда не спит и не теряет концентрацию, хотя, как и в случае с любым стажером, человеку все равно нужно проверить работу.

Compute

Хотя это и многозначный термин, compute обычно означает критически важную вычислительную мощность, которая позволяет AI-моделям работать. Этот тип обработки питает индустрию AI, давая ей возможность обучать и разворачивать свои мощные модели. Термин часто используется как сокращение для обозначения аппаратного обеспечения, которое обеспечивает такую вычислительную мощность, — таких вещей, как GPU, CPU, TPU и другие формы инфраструктуры, составляющие фундамент современной индустрии AI.

Deep learning

Это подмножество самообучающегося machine learning, в котором AI-алгоритмы спроектированы в виде многослойной структуры artificial neural network (ANN). Это позволяет им выстраивать более сложные корреляции по сравнению с более простыми системами на основе machine learning, такими как линейные модели или деревья решений. Структура deep learning-алгоритмов вдохновлена взаимосвязанными путями нейронов в человеческом мозге.

Модели deep learning способны сами выявлять важные характеристики в данных, а не требовать, чтобы инженеры задавали эти признаки вручную. Такая структура также поддерживает алгоритмы, которые могут учиться на ошибках и через процесс повторения и корректировки улучшать собственные результаты. Однако системам deep learning требуется очень много точек данных, чтобы показывать хорошие результаты (миллионы и больше). Обычно они также обучаются дольше, чем более простые machine learning-алгоритмы, — поэтому затраты на разработку, как правило, выше.

(См.: Neural network)

Diffusion

Diffusion — это технология, лежащая в основе многих AI-моделей, генерирующих изображения, музыку и текст. Вдохновленные физикой, diffusion-системы постепенно «разрушают» структуру данных — например, фотографий, песен и так далее — добавляя шум, пока от исходного сигнала почти ничего не остается. В физике diffusion — самопроизвольный и необратимый процесс: сахар, растворившийся в кофе, уже нельзя вернуть в форму кубика. Но diffusion-системы в AI стремятся научиться некоему процессу «обратной диффузии», чтобы восстанавливать разрушенные данные и уметь извлекать их из шума.

Distillation

Distillation — это техника, используемая для извлечения знаний из большой AI-модели с помощью схемы «учитель-ученик». Разработчики отправляют запросы teacher model и записывают ответы. Иногда ответы сравнивают с набором данных, чтобы проверить их точность. Затем эти выходные данные используются для обучения student model, которая должна приблизить поведение учителя.

Distillation можно использовать для создания более маленькой и эффективной модели на основе большей модели с минимальным distillation loss. Вероятно, именно так OpenAI разработала GPT-4 Turbo — более быструю версию GPT-4.

Fine-tuning

Это дальнейшее обучение AI-модели для оптимизации ее работы под более конкретную задачу или область, чем та, которая была в центре ее предыдущего обучения, — обычно за счет добавления новых специализированных, то есть ориентированных на задачу данных.

Многие AI-стартапы берут large language models за основу для коммерческого продукта, а затем стремятся повысить полезность для целевого сектора или задачи, дополняя ранние циклы обучения fine-tuning на основе собственных отраслевых знаний и экспертизы.

(См.: Large language model [LLM])

GAN

GAN, или Generative Adversarial Network, — это тип framework machine learning, который лежит в основе некоторых важных разработок в generative AI, когда речь идет о создании реалистичных данных, включая, но не только, deepfake-инструменты. GAN используют пару neural networks, одна из которых опирается на обучающие данные, чтобы сгенерировать выход, который затем передается другой модели для оценки.

По сути, две модели запрограммированы пытаться превзойти друг друга. Generator старается провести свой результат мимо discriminator, а discriminator пытается распознать искусственно сгенерированные данные. Такое структурированное соревнование может оптимизировать результаты AI, делая их более реалистичными без дополнительного вмешательства человека. При этом GAN лучше всего работают в более узких задачах, например при создании реалистичных фото или видео, а не в AI общего назначения.

Hallucination

Hallucination — это предпочитаемый в индустрии AI термин для ситуации, когда AI-модели выдумывают информацию, то есть буквально генерируют неверные данные. Очевидно, это огромная проблема для качества AI.

Hallucinations могут приводить к результатам GenAI, которые вводят в заблуждение и даже могут создавать риски в реальной жизни — с потенциально опасными последствиями, например когда на медицинский запрос выдается вредный совет.

Считается, что проблема выдумывания информации AI возникает из-за пробелов в обучающих данных. Hallucinations подталкивают индустрию к более специализированным и вертикальным AI-моделям — то есть domain-specific AI, которым нужна более узкая экспертиза, — чтобы снизить вероятность пробелов в знаниях и уменьшить риски дезинформации.

Inference

Inference — это процесс запуска AI-модели. По сути, это момент, когда модели дают свободу делать прогнозы или выводы на основе уже виденных данных. Важно: inference не может происходить без training; модель должна сначала выучить закономерности в наборе данных, прежде чем сможет эффективно экстраполировать их.

Inference могут выполнять многие типы оборудования — от процессоров смартфонов до мощных GPU и специализированных AI-ускорителей. Но не все они одинаково хорошо запускают модели. Очень большим моделям понадобилось бы огромное время, чтобы делать прогнозы, скажем, на ноутбуке по сравнению с облачным сервером на высокопроизводительных AI-чипах.

См.: Training

Large language model (LLM)

Large language models, или LLMs, — это AI-модели, которые используют популярные AI-ассистенты, такие как ChatGPT, Claude, Google’s Gemini, Meta’s AI Llama, Microsoft Copilot или Mistral’s Le Chat. Когда вы общаетесь с AI-ассистентом, вы взаимодействуете с large language model, которая обрабатывает ваш запрос напрямую или с помощью доступных инструментов, таких как веб-поиск или code interpreters.

LLM — это глубокие neural networks, состоящие из миллиардов числовых параметров, или весов (см. ниже), которые учатся связям между словами и фразами и создают представление языка, своего рода многомерную карту слов.

Эти модели создаются путем кодирования закономерностей, обнаруженных ими в миллиардах книг, статей и расшифровок. Когда вы задаете LLM запрос, модель генерирует наиболее вероятный шаблон, который соответствует этому запросу.

(См.: Neural network)

Memory cache

Memory cache — это важный процесс, который ускоряет inference, то есть процесс, в ходе которого AI генерирует ответ на запрос пользователя. По сути, caching — это техника оптимизации, призванная сделать inference более эффективным. Очевидно, что AI опирается на высокоэнергетические математические вычисления, и каждый раз, когда эти вычисления выполняются, они расходуют дополнительную мощность. Caching призван сократить число вычислений, которые модели приходится выполнять, сохраняя определенные расчеты для будущих пользовательских запросов и операций. Существуют разные виды memory caching, хотя один из самых известных — KV (или key value) caching. KV caching работает в transformer-based моделях и повышает эффективность, ускоряя результаты за счет сокращения времени и алгоритмической работы, необходимых для ответов на вопросы пользователей.

(См.: Inference)

Neural network

Neural network — это многослойная алгоритмическая структура, лежащая в основе deep learning и, шире, всего бума generative AI-инструментов после появления large language models.

Хотя идея черпать вдохновение в тесно взаимосвязанных путях человеческого мозга как в дизайнерской структуре для алгоритмов обработки данных восходит еще к 1940-м годам, именно более недавний рост графических процессоров, или GPU, через индустрию видеоигр по-настоящему раскрыл потенциал этой теории. Эти чипы оказались хорошо приспособлены для обучения алгоритмов с гораздо большим числом слоев, чем это было возможно раньше, — что позволило AI-системам на основе neural network показывать значительно более высокие результаты во многих областях, включая распознавание голоса, автономную навигацию и поиск лекарств.

(См.: Large language model [LLM])

Open source

Open source относится к программному обеспечению — а все чаще и к AI-моделям, — в котором исходный код открыт для любого желающего: его можно использовать, изучать или изменять. В мире AI заметный пример — семейство моделей Meta Llama; в истории операционных систем знаменитым параллелем является Linux. Open source-подходы позволяют исследователям, разработчикам и компаниям по всему миру строить работу друг на друге, ускоряя прогресс и делая возможными независимые проверки безопасности, которые закрытые системы не могут легко обеспечить. Closed source означает, что код приватный: продуктом можно пользоваться, но нельзя увидеть, как он работает, как в случае с моделями GPT от OpenAI, — и это различие стало одной из определяющих тем спора в индустрии AI.

Parallelization

Parallelization означает выполнение многих действий одновременно, а не по очереди — как если бы 10 сотрудников работали над разными частями проекта параллельно, вместо того чтобы один сотрудник делал все последовательно. В AI parallelization фундаментальна и для training, и для inference: современные GPU специально созданы для выполнения тысяч вычислений параллельно, и именно это стало одной из главных причин, почему они превратились в аппаратную основу отрасли. По мере того как AI-системы становятся сложнее, а модели — больше, способность распределять работу между множеством чипов и множества машин стала одним из важнейших факторов, определяющих, как быстро и экономично можно строить и разворачивать модели. Исследования более эффективных стратегий parallelization теперь сами по себе стали отдельной областью.

RAMageddon

RAMageddon — это забавный новый термин для не очень забавной тенденции, которая захлестнула техоиндустрию: все более острого дефицита random access memory, или чипов RAM, которые питают почти все технологические продукты, которыми мы пользуемся каждый день. По мере расцвета индустрии AI крупнейшие технологические компании и AI-лаборатории, соревнующиеся за создание самого мощного и эффективного AI, покупают столько RAM для своих дата-центров, что для остальных почти ничего не остается. А этот узкий канал поставок означает, что то, что осталось, становится все дороже.

Это затрагивает и такие отрасли, как игры, где крупным компаниям пришлось поднимать цены на консоли, потому что стало труднее находить чипы памяти для своих устройств, и потребительскую электронику, где дефицит памяти может привести к крупнейшему за более чем десятилетие падению поставок смартфонов, и корпоративные вычисления в целом, потому что компаниям не удается получить достаточно RAM для собственных дата-центров. Ожидается, что рост цен остановится только после окончания этого дефицита, но, к сожалению, пока не видно, что это произойдет в ближайшее время.

Reinforcement learning

Reinforcement learning — это способ обучения AI, при котором система учится, пробуя варианты и получая награды за правильные ответы — как дрессировка любимого питомца лакомствами, только «питомец» в этом случае — neural network, а «лакомство» — математический сигнал, обозначающий успех. В отличие от supervised learning, где модель обучается на фиксированном наборе размеченных примеров, reinforcement learning позволяет модели исследовать среду, совершать действия и постоянно обновлять свое поведение на основе получаемой обратной связи. Этот подход оказался особенно мощным для обучения AI играть в игры, управлять роботами и, в последнее время, улучшать способность large language models к рассуждению. Техники вроде reinforcement learning from human feedback, или RLHF, теперь занимают центральное место в том, как ведущие AI-лаборатории донастраивают свои модели, делая их более полезными, точными и безопасными.

Token

Когда речь идет о коммуникации между человеком и машиной, возникают очевидные сложности: люди общаются на человеческом языке, а AI-программы выполняют задачи через сложные алгоритмические процессы, основанные на данных. Tokens соединяют эти миры: это базовые строительные блоки общения человека с AI, представляющие дискретные фрагменты данных, обработанные или сгенерированные LLM. Они создаются в процессе tokenization, который разбивает исходный текст на небольшие единицы, которые language model может «переварить», примерно как компилятор переводит человеческий язык в двоичный код, понятный компьютеру. В корпоративной среде tokens также определяют стоимость — большинство AI-компаний берут плату за использование LLM по модели оплаты за token, так что чем больше бизнес использует, тем больше платит.

Token throughput

Итак, tokens — это небольшие фрагменты текста, часто части слов, а не целые слова, на которые AI language models разбивают язык перед обработкой; для понимания AI-нагрузок они примерно аналогичны «словам». Throughput означает, сколько может быть обработано за заданный период времени, так что token throughput — это по сути мера того, какой объем AI-работы система может обработать одновременно. Высокий token throughput — ключевая цель для команд, работающих с AI-инфраструктурой, поскольку он определяет, сколько пользователей модель может обслужить одновременно и как быстро каждый из них получает ответ. Исследователь AI Андреj Карпати описывал чувство тревоги, когда его подписки на AI простаивают, — перекликаясь с тем, что он испытывал в аспирантуре, когда дорогое компьютерное оборудование использовалось не полностью, — и это хорошо показывает, почему максимизация token throughput стала в отрасли почти навязчивой идеей.

Training

Разработка machine learning AI включает процесс, известный как training. Проще говоря, это подача данных в модель, чтобы она могла учиться на закономерностях и генерировать полезные результаты. По сути, это процесс, в котором система реагирует на характеристики данных, что позволяет ей подстраивать выходы под нужную цель — будь то распознавание изображений кошек или генерация хаику по запросу.

Training может быть дорогим, потому что требует очень много входных данных, а объемы, необходимые для этого, растут, — именно поэтому гибридные подходы, такие как fine-tuning rule-based AI на целевых данных, помогают сдерживать затраты, не начиная все с нуля.

См.: Inference

Transfer learning

Это техника, при которой ранее обученная AI-модель используется как отправная точка для создания новой модели для другой, но обычно связанной задачи — что позволяет повторно использовать знания, полученные в предыдущих циклах обучения.

Transfer learning может давать экономию за счет сокращения пути разработки модели. Он также может быть полезен, когда данных для задачи, под которую создается модель, сравнительно мало. Но важно отметить, что у подхода есть ограничения. Моделям, которые полагаются на transfer learning, чтобы получить обобщенные способности, вероятно, потребуется дополнительное обучение на новых данных, чтобы хорошо работать в своей целевой области.

(См.: Fine-tuning)

Weights

Weights — это основа обучения AI, поскольку они определяют, какое значение или «вес» придается разным признакам или входным переменным в данных, используемых для обучения системы, и тем самым формируют выход модели AI.

Иными словами, weights — это числовые параметры, которые определяют, что в наборе данных наиболее существенно для конкретной обучающей задачи. Они выполняют свою функцию, умножая входные значения. Обучение модели обычно начинается со случайно назначенных weights, но по мере процесса weights корректируются, поскольку модель стремится прийти к результату, который точнее соответствует цели.

Например, модель AI для прогнозирования цен на жилье, обученная на исторических данных по недвижимости для конкретного региона, может включать weights для таких признаков, как количество спален и ванных комнат, является ли дом отдельностоящим или двухквартирным, есть ли парковка, гараж и так далее.

В конечном итоге weights, которые модель присваивает каждому из этих входов, отражают, насколько сильно они влияют на стоимость объекта, исходя из заданного набора данных.

Validation loss

Validation loss — это число, показывающее, насколько хорошо AI-модель учится во время training, и чем оно ниже, тем лучше. Исследователи внимательно отслеживают его как своего рода промежуточную оценку в реальном времени, используя его, чтобы решить, когда остановить обучение, когда скорректировать hyperparameters или нужно ли изучить возможную проблему. Одна из ключевых проблем, которую оно помогает выявить, — overfitting, когда модель запоминает обучающие данные вместо того, чтобы действительно учиться закономерностям, которые можно перенести на новые ситуации. Это как разница между учеником, который действительно понимает материал, и тем, кто просто зазубрил прошлогодний экзамен: validation loss помогает понять, кем становится ваша модель.

Эта статья регулярно обновляется новой информацией.

Если вы покупаете по ссылкам в наших материалах, мы можем получить небольшую комиссию. Это не влияет на нашу редакционную независимость.

Материал — перевод статьи с английского.

Оригинал: So you’ve heard these AI terms and nodded along; let’s fix that

Подписаться на новости в Telegram