一場圍繞人工智能訓(xùn)練數(shù)據(jù)版權(quán)問題的法律爭議持續(xù)發(fā)酵。以meta為代表的科技企業(yè),因涉嫌通過BitTorrent協(xié)議從盜版資源網(wǎng)站獲取受版權(quán)保護的書籍用于訓(xùn)練大語言模型,正面臨作家群體的集體訴訟。這起始于2023年的案件,近期因meta提出新的辯護策略再次引發(fā)關(guān)注。
案件核心爭議在于BitTorrent協(xié)議的技術(shù)特性。該協(xié)議在下載文件時會自動向其他用戶上傳數(shù)據(jù),作家方認為這一特性使meta構(gòu)成直接版權(quán)侵權(quán)。meta則辯稱,上傳行為是技術(shù)運行的必然結(jié)果,且通過BitTorrent獲取數(shù)據(jù)是訓(xùn)練模型的必要手段——以安娜檔案庫為例,該網(wǎng)站的數(shù)據(jù)集僅支持通過BitTorrent批量下載,其他方式均不可行。
meta在最新提交的法庭文件中強調(diào),其使用BitTorrent的目的是高效獲取訓(xùn)練數(shù)據(jù),而上傳行為僅是下載過程的附屬結(jié)果。公司律師指出:"即使原告能證明作品在下載過程中被'提供'給其他用戶,這也只是實現(xiàn)轉(zhuǎn)換性合理使用目的的必要環(huán)節(jié)。"meta進一步援引作家證詞稱,未發(fā)現(xiàn)其模型輸出內(nèi)容直接復(fù)制書籍文字,以此削弱市場損害主張。
作家群體對meta的辯護策略表示強烈不滿。他們指出,meta早在2024年11月就已知曉上傳指控,卻選擇在證據(jù)開示截止日期后提交新抗辯,涉嫌規(guī)避程序規(guī)則。作家律師在致法官函中表示:"《聯(lián)邦民事訴訟規(guī)則》的補充義務(wù)不是為新增抗辯理由提供的漏洞。"
meta隨即反駁稱,針對直接侵權(quán)指控的合理使用論點并非新主張,并在2025年12月的案件管理聲明中已明確標(biāo)注。公司援引庭審記錄顯示,原告律師曾就此作出回應(yīng)。meta還強調(diào),其在人工智能領(lǐng)域的投入幫助美國保持全球技術(shù)領(lǐng)先地位,暗示這一公共利益應(yīng)納入裁決考量。
案件目前僅剩BitTorrent傳播指控未決。法官需裁定meta的"技術(shù)必要性合理使用"抗辯是否成立,這一裁決將影響多起涉及盜版數(shù)據(jù)訓(xùn)練AI的同類訴訟。作家方堅持認為,meta的行為本質(zhì)是利用技術(shù)漏洞規(guī)避版權(quán)責(zé)任,而科技企業(yè)則試圖將數(shù)據(jù)獲取方式納入合理使用范疇。
隨著法律辯論深入,雙方圍繞技術(shù)細節(jié)與法律原則展開激烈交鋒。meta強調(diào)模型訓(xùn)練的轉(zhuǎn)換性用途,作家方則聚焦于數(shù)據(jù)獲取方式的合法性。這場爭議不僅關(guān)乎具體案件走向,更將決定人工智能時代版權(quán)保護的邊界——是允許技術(shù)發(fā)展突破傳統(tǒng)法律框架,還是要求創(chuàng)新必須建立在合規(guī)基礎(chǔ)之上。










