谷歌近日宣布,其Gemini應(yīng)用完成重要升級,正式整合DeepMind旗下前沿音樂生成模型Lyria 3。這項技術(shù)突破使得用戶僅需輸入文字描述或上傳圖片,即可在短時間內(nèi)獲得一段30秒的完整音樂作品,涵蓋人聲、歌詞與伴奏的完整創(chuàng)作鏈條。
在創(chuàng)作維度上,Lyria 3展現(xiàn)出高度靈活性。用戶既可以通過文字指令指定音樂風(fēng)格、情緒基調(diào)或節(jié)奏類型,系統(tǒng)將自動生成匹配的完整曲目;也能上傳視覺素材,模型通過分析畫面色彩、構(gòu)圖與氛圍,輸出與之契合的背景音樂,并配備由AI設(shè)計的專屬封面藝術(shù)。針對短視頻創(chuàng)作者,YouTube平臺特別推出Dream Track功能,目前已在北美地區(qū)上線,支持為Shorts內(nèi)容快速配樂。
資本市場對這項技術(shù)革新反應(yīng)迅速。消息公布當日,流媒體巨頭Spotify股價盤中漲幅收窄近5個百分點,衛(wèi)星廣播服務(wù)商Sirius XM股價亦出現(xiàn)短暫回調(diào)。行業(yè)觀察人士指出,雖然Lyria 3短期內(nèi)難以撼動現(xiàn)有音樂平臺的用戶基礎(chǔ),但可能促使競爭對手加速布局AI混音等智能化功能。
谷歌在技術(shù)落地過程中著重構(gòu)建版權(quán)保護機制。當用戶提示涉及真實音樂人時,系統(tǒng)僅將其作為風(fēng)格參考對象,生成相似氛圍的作品而非直接模仿,同時內(nèi)置內(nèi)容過濾器防止侵權(quán)輸出。所有創(chuàng)作成果均采用SynthID技術(shù)嵌入隱形數(shù)字水印,確保AI生成內(nèi)容的可追溯性。
面對音樂行業(yè)對生成式AI的普遍憂慮,谷歌通過技術(shù)手段劃定創(chuàng)新邊界。這項升級既增強了消費級產(chǎn)品的市場競爭力,也向投資者展示了人工智能技術(shù)的商業(yè)轉(zhuǎn)化潛力。目前該服務(wù)已面向全球成年用戶開放,支持英、德、西、法、印地、日、韓、葡等八種語言,后續(xù)計劃拓展更多語種并優(yōu)化音質(zhì)表現(xiàn)。






