Google тихо выпустила на iOS офлайн-первое ИИ-приложение для диктовки

Коротко: Google без громкого анонса запустила на iPhone новое приложение для диктовки Google AI Edge Eloquent, которое делает ставку на офлайн-обработку и модели Gemma, конкурируя с Wispr Flow, SuperWhisper, Willow и другими.

Ключевые тезисы

  • Приложение бесплатно и после загрузки Gemma-based ASR-моделей позволяет диктовать прямо на устройстве.
  • Во время набора можно видеть живую расшифровку, а при паузе приложение убирает слова-паразиты и очищает текст.
  • Есть режимы преобразования текста: Key points, Formal, Short и Long.
  • Пользователь может отключить облачный режим и оставить локальную обработку; при включенном облаке для очистки текста используются модели Gemini.
  • Приложение умеет импортировать из Gmail некоторые ключевые слова, имена и жаргон, а также добавлять пользовательские слова.

Google в понедельник тихо выпустила на iOS приложение для диктовки Google AI Edge Eloquent, сделав ставку на офлайн-first подход и модели Gemma. Новый инструмент нацелен на конкурентов вроде Wispr Flow, SuperWhisper, Willow и других сервисов для speech-to-text.

Приложение можно скачать бесплатно. После загрузки Gemma-based моделей автоматического распознавания речи пользователь может сразу начать диктовать на телефоне. В интерфейсе видна живая транскрипция, а при паузе приложение автоматически убирает слова-паразиты вроде “um” и “ah”, а затем полирует текст.

Под расшифровкой доступны варианты преобразования текста: Key points, Formal, Short и Long. Также можно отключить cloud mode и использовать только локальную обработку. Если облачный режим включен, для очистки текста Google использует cloud-based Gemini models.

Дополнительные функции и интеграция

Google AI Edge Eloquent может импортировать из аккаунта Gmail некоторые ключевые слова, имена и профессиональный жаргон, если пользователь этого хочет. Кроме того, можно добавить собственные слова в список.

Приложение сохраняет историю сеансов диктовки и позволяет искать по ним. Внутри также показываются слова, продиктованные в последней сессии, скорость в словах в минуту и общее число произнесенных слов.

В описании в App Store Google называет Eloquent «продвинутым приложением для диктовки», которое должно превращать естественную речь в готовый к использованию текст. Там же говорится, что приложение автоматически удаляет “ums”, “uhs” и самокоррекции посреди фразы, чтобы выдавать чистую прозу.

Пока приложение доступно только на iOS, но в описании в App Store уже есть ссылка на Android-версию. Также упоминается «seamless Android integration»: возможность сделать приложение клавиатурой по умолчанию для системного доступа из любого текстового поля и использовать floating button, похожую на ту, что есть у Wispr Flow на Android.

ИИ-приложения для транскрипции становятся все популярнее по мере того, как speech-to-text модели улучшаются. С экспериментальным Eloquent Google присоединяется к этой растущей категории продуктов.


Источник: Google quietly releases an offline-first AI dictation app on iOS

Telegram-канал: https://t.me/no_glam_AI