谷歌DeepMind近日推出全新AI音樂生成模型Lyria 3,該模型以測試版形式集成至Gemini應(yīng)用,面向全球成年用戶開放免費(fèi)使用。作為谷歌迄今為止最復(fù)雜的音樂生成系統(tǒng),這款工具通過技術(shù)創(chuàng)新重新定義了人機(jī)協(xié)作創(chuàng)作音樂的邊界。
核心功能突破體現(xiàn)在全場景適配能力上。用戶無需專業(yè)音樂知識(shí)即可通過三種交互方式完成創(chuàng)作:輸入"用藍(lán)調(diào)風(fēng)格創(chuàng)作一首關(guān)于雨夜思念的慢歌"等自然語言描述,系統(tǒng)能在數(shù)秒內(nèi)生成包含人聲、歌詞和完整編曲的30秒作品;上傳風(fēng)景照片或藝術(shù)插畫后,模型可分析畫面情感色彩并創(chuàng)作匹配的原創(chuàng)配樂,同時(shí)自動(dòng)生成專輯封面;針對(duì)短視頻創(chuàng)作者,系統(tǒng)能精準(zhǔn)捕捉畫面節(jié)奏變化,生成與視覺內(nèi)容同步的背景音樂。
技術(shù)實(shí)現(xiàn)層面,該模型采用多模態(tài)理解架構(gòu),支持對(duì)文本、圖像、視頻的跨維度解析。生成過程中用戶可實(shí)時(shí)調(diào)整參數(shù),包括選擇流行、爵士等20余種音樂風(fēng)格,指定男聲、女聲或和聲類型,以及控制作品速度。輸出音頻達(dá)到CD級(jí)音質(zhì)標(biāo)準(zhǔn),支持中、英、日等15種語言的人聲合成。
這款工具的推出標(biāo)志著音樂創(chuàng)作門檻的進(jìn)一步降低。從獨(dú)立音樂人到短視頻創(chuàng)作者,不同領(lǐng)域的用戶均可通過自然交互獲得專業(yè)級(jí)音樂素材。測試期間數(shù)據(jù)顯示,用戶平均創(chuàng)作耗時(shí)較傳統(tǒng)方式縮短87%,作品滿意度達(dá)到92%。隨著技術(shù)持續(xù)迭代,AI生成音樂在影視配樂、游戲音效等領(lǐng)域的應(yīng)用前景引發(fā)行業(yè)關(guān)注。










