Google добавила диктовку на базе Gemini в Gboard — это может ударить по стартапам в сфере распознавания речи — ИИ для бизнеса

Google добавила диктовку на базе Gemini в Gboard — это может ударить по стартапам в сфере распознавания речи

Прослушать статью

Автор изображения: Jagmeet Singh / TechCrunch

Google добавила Rambler — новую функцию голосовой диктовки на базе ИИ для Gboard, своего широко используемого Android-клавиатурного приложения, — на мероприятии Android Show: I/O Edition 2026 во вторник утром. Запуск выводит Google в прямую конкуренцию с Wispr Flow и Typeless и другими быстро растущими AI-приложениями для диктовки, которые в последние годы собрали аудиторию на компьютерах и мобильных устройствах, но пока так и не закрепились на Android.

Как и другие приложения для диктовки, Rambler удаляет слова-паразиты вроде «ums» и «ahs». Он также понимает исправления в середине предложения, например: «Я встречусь с тобой в среду в нашем обычном кафе в 15:00… мм, в 14:00».

Google заявила, что использует многоязычные модели на базе Gemini, которые также поддерживают code switching. Code switching означает, что пользователи могут переключаться между языками прямо в середине фразы — например, с английского на хинди, — и Rambler продолжит работу без потери контекста. Это возможность, которая отражает то, как многие многоязычные пользователи действительно говорят, и которой большинство западных приложений для диктовки до сих пор уделяли мало внимания.

Компания заявила, что Gboard будет явно показывать пользователям, что функция Rambler включена. Она не сохраняет голосовые записи и использует аудио только для преобразования речи в текст. Во время брифинга Google отметила, что, поскольку функцию Rambler можно использовать во всех приложениях, это похоже на «переизобретение клавиатуры».

0 секунд из 28 секунд, громкость 90%

Нажмите Shift + ? для списка сочетаний клавиш

Сочетания клавиш включены/выключены

Сочетания клавиш: открыть/закрыть, / или ?

Воспроизведение/пауза: SPACE

Увеличить громкость: ↑

Уменьшить громкость: ↓

Перемотка вперед: →

Перемотка назад: ←

Субтитры вкл./выкл.: c

Полноэкранный режим/выход: f

Вкл./выкл. звук: m

Уменьшить размер субтитров: —

Увеличить размер субтитров: + или =

Переход по %: 0-9

Авто 480p 1280p 960p 720p 640p 480p 320p

В прямом эфире

00:00

00:28

00:28

Что касается конфиденциальности, директор Android Core Experiences Бен Гринвуд сказал, что Google использует сочетание локальной и облачной обработки и «значительно инвестировала в течение многих лет», чтобы обеспечить «безопасность и приватность» функций — это продуманное сообщение пользователям, которые сравнивают Rambler со сторонними приложениями для диктовки, где данные могут обрабатываться иначе.

За последние несколько лет появилось множество приложений для диктовки — Wispr Flow, Willow, SuperWhisper, Monoglogue, Handy и Typeless. Но до сих пор основная активность была сосредоточена на десктопе и iOS, а Android оставался относительно обделенным. Сама Google в прошлом месяце выпустила AI Edge Eloquent — приложение для диктовки с приоритетом офлайн-режима, работающее на локальных моделях Gemma AI, — на iOS.

Rambler — самый явный шаг Google к тому, чтобы закрыть этот разрыв. На первом летнем этапе эти новые функции будут доступны только на Samsung Galaxy и Google Pixel, но позже появятся и на других Android-устройствах. Главное преимущество здесь — дистрибуция: Gboard является клавиатурой по умолчанию для подавляющего большинства пользователей Android по всему миру, а значит, Rambler будет предустановлен для сотен миллионов людей. Когда игрок платформенного уровня выходит на рынок на уровне операционной системы, отдельным приложениям нужна веская причина — более высокая точность, более глубокие функции или более сильные гарантии приватности, — чтобы пользователь решил скачать их отдельно.

Для стартапов в сфере диктовки вопрос уже не в том, могут ли они сделать хороший продукт, а в том, смогут ли они сделать его настолько хорошим, чтобы пользователи сами искали именно его.


Материал — перевод статьи с английского.

Оригинал: Google adds Gemini-powered Dictation to Gboard, which could be bad news for dictation startups