Parloa строит голосовых AI-агентов для клиентского сервиса на базе OpenAI
7 мая 2026 года
Стартап
Parloa строит голосовых сервисных агентов, с которыми клиенты хотят разговаривать
Parloa использует модели OpenAI, чтобы моделировать, оценивать и запускать голосовые системы клиентского сервиса для бизнеса.
Размер компании: стартап
Регион: Европа и Великобритания, глобально
Индустрия: технологии
Продукты: API
В первые годы работы Parloa сооснователь Штефан Оствальд провел день в страховом call center, где его команда создавала ранние голосовые сценарии. Сидя рядом с операторами, он снова и снова слышал одни и те же разговоры: сбросы паролей, вопросы по полисам, обычные изменения в услугах. Он понял, что значительную часть этой работы можно автоматизировать.
С появлением ChatGPT компания эволюционировала и начала строить то, что сегодня называется AI Agent Management Platform (AMP), основанную на новом поколении моделей, включая GPT‑5.4.
AMP дает компаниям возможность проектировать, разворачивать и управлять взаимодействиями клиентского сервиса в масштабе. Вместо жестких списков интентов и сценариев команды задают поведение на естественном языке, подключают внутренние системы и быстро итеративно улучшают систему с помощью встроенных симуляций и оценок.
Parloa обрабатывает эти взаимодействия end to end, от простого маршрутизирования до сложных многошаговых запросов. В центре внимания — стабильность в production, где важны производительность, latency и edge cases. Чтобы добиться этого, Parloa непрерывно тестирует модели на реальных клиентских сценариях до разворачивания.
«Модели имеют значение только тогда, когда они работают в production. Мы тесно сотрудничаем с OpenAI, чтобы сделать модели достаточно быстрыми и надежными для разговоров в реальном времени».
—Ciaran O’Reilly Ibañez, Engineering Manager в Parloa
Проектирование AMP для корпоративных команд
Agent Management Platform (AMP) от Parloa создана для бизнес-пользователей и предметных экспертов, чтобы они могли собирать AI-агентов без написания кода.
«С AMP мы можем позволить предметным экспертам из разных бизнес-подразделений действительно собирать агентов и подключать API гораздо более экономным и простым способом», — говорит О’Рейли.
На высоком уровне AMP позволяет брендам управлять всем жизненным циклом AI-агента. Для этого нетехническим командам дают более простой способ определить, как агент должен вести себя еще до запуска. Вместо написания кода или построения жестких деревьев интентов предметные эксперты задают роль агента, инструкции, инструменты и ограничения на естественном языке. Эта конфигурация становится основой для того, как модель получает prompt и как система ведет себя в production.
После определения агент проходит тестирование до развертывания. Parloa моделирует разговоры с клиентами с помощью моделей вроде GPT‑5.4, где одна модель выступает в роли звонящего, а другая — в роли настроенного агента. Команды могут напрямую просматривать эти взаимодействия, проверять изменения на реалистичных сценариях и итеративно улучшать систему до запуска.
Затем те же модели используются для оценки разговоров с помощью сочетания детерминированных проверок и scoring в стиле LLM-as-a-judge. Это показывает, следовал ли агент инструкциям, правильно ли использовал инструменты и выполнил ли задачу так, как ожидалось.
Во время живого разговора orchestration layer AMP подает в OpenAI-модель конфигурацию агента и контекст беседы, чтобы сгенерировать ответ, получить информацию через RAG или вызвать инструменты для взаимодействия с backend-системами клиента. Parloa постоянно обновляет этот слой последним поколением моделей, когда они демонстрируют явные улучшения в реальной производительности.
После разговора отдельные рабочие процессы на базе OpenAI суммируют взаимодействие, классифицируют intent клиента и оценивают результат по заданным правилам.
По мере усложнения агентов поддерживать один монолитный prompt становилось все труднее. Небольшие изменения могли вызывать нежелательные побочные эффекты. Чтобы решить эту проблему, Parloa внедрила модульный подход. Задачи вроде аутентификации, изменения бронирования или обновления аккаунта можно разделять на отдельные sub-agents, что улучшает следование инструкциям и упрощает развитие системы со временем.
Одновременно платформа использует детерминированные controls там, где надежность особенно важна. Компании могут задавать структурированные цепочки API и логику на основе событий, чтобы критические шаги выполнялись в правильном порядке, сочетая гибкость диалога с предсказуемым исполнением.
Parloa использует модели вроде GPT‑4.1, GPT‑5‑mini и другие, чтобы симулировать реалистичные взаимодействия с клиентами еще до запуска агента, а затем оценивает эти взаимодействия с помощью сочетания LLM-as-a-judge и детерминированных правил. Это позволяет командам тестировать edge cases, быстро итеративно улучшать систему и проверять ее работоспособность до того, как она столкнется с ошибками на стороне клиентов.
Подход, в котором оценка стоит на первом месте
Parloa работает прежде всего с крупными enterprise-компаниями, где последовательность не менее важна, чем возможности.
«Когда выходит новая модель, мы прогоняем по ней наш benchmarking suite», — говорит Маттхаус Дойч, Senior Applied Scientist. «Для нас очень важно, чтобы все работало не только в теоретических бенчмарках, но и в реальных сценариях использования».
Вместо абстрактных бенчмарков Parloa воспроизводит реальные production-агенты и прогоняет их через пайплайны симуляции и оценки. Эти тесты измеряют надежность следования инструкциям, стабильность вызовов API, latency и общую производительность в реалистичных условиях.
Именно эти оценки определяют, какие модели готовы к production. Разворачиваются только те модели, которые надежно работают в реальных клиентских сценариях.
«Enterprise-клиенты сталкиваются с реальными издержками миграции», — говорит Дойч. «Когда система уже работает в production, они стараются сохранить ее стабильной и переходят только тогда, когда выгода очевидна».
В результате системы ведут себя предсказуемо в production даже в масштабе. На миллионах клиентских взаимодействий большинство разговоров завершается без трения. Даже когда звонки переводятся на живых операторов, эскалация редко вызвана сбоем. В одном из внедрений глобальная туристическая компания сократила число запросов на живого оператора на 80%.
Подход, в котором оценка стоит на первом месте, стал ключевым преимуществом и позволил Parloa двигаться быстрее, не жертвуя надежностью в production.
Создание для голоса в глобальном масштабе
Голосовые сценарии накладывают другие ограничения, чем текстовый чат. Каждый диалог проходит через низколатентный pipeline: speech-to-text, reasoning модели и text-to-speech.
Из-за этого latency становится критически важной. Даже небольшие задержки на уровне модели накапливаются и превращаются в заметные паузы для звонящего, что влияет на то, как модели выбирают и оптимизируют.
Parloa тесно работает с OpenAI над оптимизацией производительности для сценариев в реальном времени, делая упор на latency, качество ответов и следование инструкциям. Команда постоянно оценивает и стресс-тестирует новые итерации моделей в средах, близких к production, прежде чем выкатывать их в живые клиентские взаимодействия.
Parloa оценивает каждый компонент voice stack отдельно:
- системы speech-to-text тестируют по word error rate, особенно для чувствительных данных вроде номеров полисов или идентификаторов аккаунтов;
- модели text-to-speech оценивают с помощью слепых тестов на прослушивание, чтобы понять, насколько естественно звучит голос для реальных пользователей. Затем эти результаты сверяют с реальными клиентскими взаимодействиями, чтобы обеспечить стабильную производительность в production-среде;
- модели speech-to-speech сейчас оцениваются на готовность к production с акцентом на latency, точность и стоимость.
С самого начала эти системы создавались для глобального развертывания. Бенчмарки охватывают множество языков, а клиенты работают в регионах по всему миру. Такая многоязычная строгость отражает и европейские корни Parloa, и ожидания enterprise-клиентов, которым нужна стабильная производительность на разных рынках, а не только в одном языке или регионе.
Сегодня агенты Parloa обрабатывают миллионы разговоров в таких отраслях, как retail, travel и страхование, поддерживая сценарии от автоматизации поддержки до revenue-generating flows, например teleshopping.
Технологии, меняющиеся вместе с клиентскими маршрутами
Parloa видит, как клиентский сервис превращается в полностью multimodal-опыт.
Разговор может начаться по телефону, продолжиться в чате и по пути включать ссылки или интерактивные элементы. Вместо того чтобы рассматривать каждый шаг как отдельный поток, AMP спроектирована так, чтобы обрабатывать все это как единое взаимодействие. Со временем AI-агенты могут стать для клиентских маршрутов такими же центральными, как сайты и мобильные приложения.
Поскольку компании переходят к автоматизации все большей доли клиентских взаимодействий, Parloa сосредоточена на том, чтобы AI-агенты были достаточно надежными, гибкими и заслуживающими доверия для работы в глобальном масштабе.
OpenAI <3 startups
Читать далее
Gradient Labs дает каждому банковскому клиенту AI-менеджера счета Startup Apr 1, 2026
Как Descript строит многоязычный видеодубляж в масштабе Startup Mar 6, 2026
Внутри разговорного подхода Praktika к изучению языков Startup Jan 22, 2026
Материал — перевод статьи с английского.
Оригинал: Parloa builds service agents customers want to talk to