Google Docs近日在原有文本朗讀功能基礎(chǔ)上,新增了語音摘要服務(wù),目前正在網(wǎng)頁端逐步開放。用戶通過"工具"菜單即可找到新增的"收聽文檔摘要"選項(xiàng),該功能與現(xiàn)有的"收聽當(dāng)前標(biāo)簽頁"并列呈現(xiàn),形成完整的語音交互體系。
這項(xiàng)創(chuàng)新功能依托Gemini技術(shù)構(gòu)建,能夠自動(dòng)分析文檔內(nèi)容并生成精煉的口頭概述。系統(tǒng)會(huì)智能提取單個(gè)或多個(gè)標(biāo)簽頁的核心信息,將冗長(zhǎng)的文字轉(zhuǎn)化為時(shí)長(zhǎng)控制在幾分鐘內(nèi)的自然語音表述。這種處理方式既保留了關(guān)鍵信息,又避免了機(jī)械化的語音輸出。
操作界面配備專業(yè)級(jí)音頻控制模塊,除常規(guī)播放暫停功能外,還支持0.5倍至2倍速的變速播放。時(shí)間軸拖動(dòng)條的設(shè)計(jì)讓用戶可以精準(zhǔn)定位關(guān)鍵段落,配合"敘述者""說服者""指導(dǎo)者"等多樣化語音風(fēng)格選項(xiàng),滿足會(huì)議記錄、學(xué)術(shù)研究、商業(yè)報(bào)告等不同場(chǎng)景的需求。
實(shí)際應(yīng)用場(chǎng)景顯示,該功能特別適合需要快速獲取信息的場(chǎng)景。職場(chǎng)人士可在會(huì)議開始前通過語音快速回顧紀(jì)要內(nèi)容,研究人員處理長(zhǎng)篇報(bào)告時(shí)能優(yōu)先掌握核心論點(diǎn),學(xué)生群體復(fù)習(xí)資料時(shí)也能高效定位重點(diǎn)章節(jié)。這種非線性閱讀方式顯著提升了信息處理效率,尤其適合移動(dòng)辦公場(chǎng)景下的碎片化時(shí)間利用。











