舊金山聯邦地區法院於 2025 年 6 月 23 日由 William Alsup 法官作出裁決,涉及 Anthropic 公司使用版權材料來訓練其 AI 服務 Claude。法院裁定,將版權作品用於訓練 AI 模型是「極具變革性」的,因此屬於合理使用。然而,裁決也指出,Anthropic 使用「盜版」副本建立中央數位圖書館的行為不屬於合理使用,此問題將進入審判階段。這項裁決對 AI 公司而言是一次部分勝利,確立了版權作品可以用於 AI 訓練的普遍原則。法院在權衡多項合理使用因素後,裁定 Anthropic 在訓練大型語言模型方面是合理的,因為其使用具有變革性且對市場影響甚微。相反,使用盜版副本建立通用圖書館的行為被認定為侵權,因為它缺乏變革性目的且並非合理必要。
法院的判決確立了一個先例,即使用版權材料訓練 AI 模型因其變革性質通常被視為合理使用。然而,判決明確劃定了資料來源的界限,裁定獲取並保留「盜版」副本以建立中央圖書館(即使其中一部分用於訓練)不屬於合理使用,並可能導致法律責任。此裁決並未就 AI 輸出是否構成侵權或合理使用給出明確答案,並暗示直接使用盜版副本進行訓練也可能不屬於合理使用,儘管這一點尚未最終裁定。
依據此判決,在公司開發和訓練 AI 模型時,應注意以下幾點:
- AI 模型訓練的合法性: 法院支持將版權作品用於 AI 模型訓練,認為這屬於「合理使用」,因為其具有「極具變革性」的本質。這意味著在合法取得原始資料的情況下,使用版權內容來訓練 AI 模型是受法律保護的。
- 資料來源的重要性: 判決的關鍵點在於資料來源的合法性。儘管訓練過程可能被視為合理使用,但若用於訓練或建立資料庫的版權作品是透過非法(如「盜版」)途徑取得,則可能構成侵權。因此,務必確保所有用於訓練 AI 的資料都來源合法,並符合版權規定。
- 避免建立「盜版」資料庫: 法院明確指出,即使部分內容用於訓練,建立和維護一個包含「盜版」版權作品的中央數位圖書館是不被允許的。這可能導致法律責任。建議公司對內部資料庫的版權合規性進行嚴格審查。
- 未來發展的關注: 此判決並未完全釐清 AI 產出本身的版權問題,以及直接使用盜版副本進行訓練是否絕對不屬於合理使用。建議持續關注相關法律判例和立法動態,以便隨時調整資料管理和 AI 開發策略。
- 版權盡職調查: 在採購、使用和管理資料時,應進行徹底的版權盡職調查,以避免潛在的法律風險。對於來源不確定的內容,應尋求法律意見。
此判決在 AI 產業版權合規方面提供了一個重要的指導框架,建議所有客戶仔細審視其現有操作,並在必要時尋求法律諮詢。