SheepNav
新上线今天0 投票

谷歌悄然发布离线优先AI听写应用,基于Gemma模型挑战Wispr Flow

谷歌近日在iOS平台低调推出了一款名为Google AI Edge Eloquent的离线优先听写应用,旨在与Wispr Flow、SuperWhisper、Willow等竞争对手一较高下。这款免费应用基于谷歌的Gemma AI模型构建,主打本地化自动语音识别(ASR)功能,无需联网即可实时转录语音,并自动过滤“嗯”、“啊”等填充词,输出精炼文本。

核心功能亮点

  • 离线优先与云端切换:应用的核心是本地运行的Gemma ASR模型,用户下载模型后即可完全离线使用。同时,应用也提供了云端模式选项,启用后会调用基于云的Gemini模型进行文本润色,为用户提供灵活性。
  • 智能文本处理:应用不仅进行实时转录,还在用户暂停时自动执行文本清理,去除口语中的犹豫、重复和自我修正,直接生成干净、准确的书面文字。
  • 个性化与上下文增强:应用支持从用户的Gmail账户导入特定关键词、姓名和行业术语,以提升专有名词的识别准确率。用户还可以手动添加自定义词汇列表,进一步个性化识别体验。
  • 丰富的后期编辑选项:转录文本下方提供了多种一键转换选项,如要点总结(Key points)正式化(Formal)缩短(Short)扩写(Long),帮助用户快速调整文本以适应不同场景。
  • 数据追踪与管理:应用会保存转录历史记录,并支持全文搜索。它还能显示上一次会话的听写内容、用户的每分钟字数(WPM)速度以及总字数统计,方便用户回顾和分析效率。

市场定位与行业背景

谷歌将这款应用定位为“旨在弥合自然口语与专业、即用型文本之间差距的高级听写工具”。在当前语音AI语音转文本模型性能飞速提升的背景下,AI驱动的转录应用正日益受到用户欢迎。Wispr Flow等应用已凭借其流畅体验获得一定市场份额。谷歌此次通过Google AI Edge Eloquent加入战局,被视为一次重要的市场测试和产品探索。

未来展望与平台扩展

值得注意的是,尽管目前仅登陆iOS平台,但该应用在App Store的描述中已明确提及Android版本的存在。描述指出,Android版本将提供更深度的系统集成,例如可设置为默认键盘,从而在任何文本输入框中实现系统级调用。此外,它还将支持类似Wispr Flow在Android上使用的浮动按钮功能,方便用户随时随地进行转录。

如果此次iOS端的实验性发布获得成功,我们很可能看到谷歌将更先进的转录功能整合至其庞大的Android生态系统中,这可能会对移动端生产力工具市场产生显著影响。

延伸阅读

  1. 2026年最佳安卓手机:专家实测与深度评测
  2. 伊朗威胁打击“星际之门”AI数据中心,美伊冲突升级波及科技基础设施
  3. 用 Amazon Quick 构建 AI 驱动的员工入职智能助手
查看原文