當?shù)貢r間周一,谷歌正式在 iOS 平臺推出了主打全離線使用的語音聽寫應(yīng)用 Google AI Edge Eloquent。這款應(yīng)用不僅打破了對網(wǎng)絡(luò)環(huán)境的依賴,更憑借大模型的潤色能力,直擊語音轉(zhuǎn)錄中“廢話多、不通順”的行業(yè)痛點。
核心亮點:離線運行,隱私與效率兼得Eloquent 的核心競爭力在于其完全基于本地算力的處理機制:
原生大模型驅(qū)動: 該應(yīng)用基于谷歌輕量化模型 Gemma 構(gòu)建,在完成對應(yīng)的 ASR(自動語音識別)模型下載后,即可實現(xiàn)100% 離線工作。
隱私護城河: 所有音頻處理均在本地設(shè)備完成,有效解決了商務(wù)會議、私人訪談等高敏感場景下的數(shù)據(jù)泄露隱憂。
特色功能:智能“去水”與文本潤色不同于傳統(tǒng)的機械式聽寫,Eloquent 具備極強的理解能力:
自動剔除語氣詞: 系統(tǒng)能精準識別并自動過濾掉“嗯、啊、那個”等無意義語氣助詞,輸出更為精煉的文本。
文本自動潤色: 在轉(zhuǎn)錄過程中提供實時潤色,使口語表達轉(zhuǎn)化為更具邏輯性的書面語言。
靈活處理模式: 用戶既可選擇極致隱私的本地處理,也可調(diào)用云端 Gemini 模型進行更高質(zhì)量的深度優(yōu)化。
生產(chǎn)力工具:深度適配專業(yè)場景為了滿足專業(yè)用戶需求,谷歌在細節(jié)功能上進行了大量打磨:
自定義詞匯: 支持導入特定行業(yè)術(shù)語或自定義詞匯,顯著提升生僻詞識別率。
多格式轉(zhuǎn)換: 轉(zhuǎn)錄完成后支持多種文件格式導出,方便后續(xù)編輯與分享。
智能檢索: 內(nèi)置會話歷史管理系統(tǒng),支持通過關(guān)鍵字快速定位歷史錄音內(nèi)容。
行業(yè)觀察:端側(cè) AI 正在接管“工具類”應(yīng)用Google AI Edge Eloquent 的發(fā)布,標志著谷歌正在加速將大模型能力下沉到端側(cè)硬件。雖然目前該應(yīng)用僅上線了 iOS 平臺,但官方已明確表示后續(xù)將適配安卓系統(tǒng)。對于同類 AI 轉(zhuǎn)錄產(chǎn)品而言,谷歌憑借模型底座與免費策略的入局,無疑將加速該賽道的洗牌。
結(jié)語:告別“后期整理”的煩惱
當 AI 能夠離線過濾廢話并自動潤色,語音聽寫將不再只是記錄工具,而是真正的生產(chǎn)力加速器。對于頻繁需要整理錄音的媒體人、學生和辦公族來說,這款“語氣詞殺手”或許將成為手機里的標配。










