Google выпустила офлайн-приложение для ИИ-диктовки на iPhone

Формат: Новость

Коротко

Google тихо представила на iOS экспериментальное приложение для диктовки Google AI Edge Eloquent. Оно использует модели Gemma для распознавания речи и может работать без подключения к облаку после загрузки моделей.

Google quietly releases an offline-first AI dictation app on iOS
Article image
Image Credit: Screenshot by TechCrunch Image Credits: Screenshot by TechCrunch
Article image
I was saying “Transcription”. Still early days for this app. Image Credits: TechCrunch Image Credits: Screenshot by TechCrunch

Ключевые тезисы

  • Приложение бесплатное и после загрузки Gemma-моделей работает как офлайн-диктовка на iPhone.
  • Во время диктовки видна живая расшифровка, а пауза автоматически убирает слова-паразиты и редактирует текст.
  • Пользователь может выбрать форматирование результата: «Key points», «Formal», «Short» или «Long».
  • Есть локальный режим без облака, а при включении cloud mode для очистки текста используются модели Gemini.
  • В описании App Store упоминается Android-версия и интеграция с клавиатурой, но на момент публикации приложение доступно только на iOS.

Детали

Это переведённый и адаптированный материал с английского источника.

Google тихо выпустила на iOS экспериментальное приложение для диктовки Google AI Edge Eloquent, которое работает в офлайн-режиме после загрузки моделей на базе Gemma. По сути, это ответ на сервисы вроде Wispr Flow, SuperWhisper и Willow.

Приложение бесплатное: после скачивания ASR-моделей можно сразу начинать диктовать на телефоне. Во время записи показывается живая расшифровка, а когда пользователь ставит паузу, приложение автоматически убирает слова-паразиты вроде «um» и «ah» и делает текст более гладким.

Что умеет приложение

Под расшифровкой доступны варианты преобразования текста:

  • Key points
  • Formal
  • Short
  • Long

Кроме того, можно отключить облачный режим и использовать только локальную обработку. Если cloud mode включён, для очистки текста задействуются облачные модели Gemini.

Google AI Edge Eloquent также может импортировать из Gmail некоторые ключевые слова, имена и профессиональный жаргон, если пользователь этого хочет. Помимо этого, можно добавить собственные слова в список.

В приложении сохраняется история сессий диктовки, по которой можно искать. Оно также показывает слова, продиктованные в последней сессии, скорость в словах в минуту и общее количество произнесённых слов.

“Google AI Edge Eloquent is an advanced dictation app engineered to bridge the gap between natural speech and professional, ready-to-use text…”

В описании App Store Google называет Eloquent продвинутым приложением для диктовки, которое превращает естественную речь в готовый к использованию текст и автоматически убирает «ums», «uhs» и самопоправки посреди фразы.

Пока только на iOS

Сейчас приложение доступно только на iPhone, но в описании App Store уже есть упоминание версии для Android. Также говорится о «бесшовной интеграции с Android», где Eloquent можно будет назначить клавиатурой по умолчанию для системного доступа к любому текстовому полю.

Ещё одна заявленная функция — плавающая кнопка для быстрого вызова диктовки, похожая на решение, которое использует Wispr Flow на Android. TechCrunch уточняет, что обратился к Google за комментариями и обновит материал, если получит ответ.

Интерес к AI-диктовке растёт по мере того, как модели распознавания речи становятся точнее. С этим экспериментом Google присоединяется к быстро развивающемуся сегменту, и в случае успеха теста улучшения могут появиться и в Android.


Оригинал на английском: Google quietly releases an offline-first AI dictation app on iOS

Telegram-канал: https://t.me/no_glam_AI