2月20日消息,據媒體報道,谷歌宣布,其Gemini應用正式集成DeepMind旗下最先進的音樂生成模型Lyria 3,用戶僅憑一句文字描述或一張照片,即可在數秒內生成一段30秒的完整音樂片段。
據谷歌介紹,Lyria 3的創作方式靈活多樣:用戶可以“描述一個想法”,比如指定某種風格、情緒或節奏,模型便能自動生成包含人聲、歌詞和伴奏的歌曲;也可以上傳照片或視頻,Lyria 3會分析畫面氛圍,創作出契合場景的配樂,并配有由Nano Banana設計的自定義封面。
YouTube創作者還可通過Dream Track功能探索Lyria 3,為Shorts短視頻配樂,該功能已在美國推出,并逐步推廣至其他地區。
消息公布后,歐美流媒體音樂平臺Spotify股價一度回吐日內近5%的漲幅,Sirius XM也短暫轉跌。有分析認為,雖然Lyria 3短期內不會對Spotify構成致命沖擊,但可能倒逼其加快推出AI混音功能。
對于谷歌而言,將音頻生成工具融入移動應用,既增強了消費者產品的競爭力,也向投資者展示了其AI投入的變現潛力。
生成式AI在音樂行業始終面臨謹慎甚至敵視的態度,許多從業者擔憂其可能威脅商業模式和知識產權。谷歌此次通過技術手段明確劃定邊界,試圖在創新與保護之間尋求平衡。
目前Lyria 3已向全球18歲以上用戶開放,支持英語、德語、西班牙語、法語、印地語、日語、韓語、葡萄牙語等語言,未來還將擴展更多語言并提升生成質量。








