使用版權作品訓練 AI 模型屬於合理使用？

美國地方法院發布 AI 合理使用裁決：使用「盜版」副本建立中央資料庫則不屬合理使用

舊金山聯邦地區法院於 2025 年 6 月 23 日由 William Alsup 法官作出裁決，涉及 Anthropic 公司使用版權材料來訓練其 AI 服務 Claude。法院裁定，將版權作品用於訓練 AI 模型是「極具變革性」的，因此屬於合理使用。然而，裁決也指出，Anthropic 使用「盜版」副本建立中央數位圖書館的行為不屬於合理使用，此問題將進入審判階段。這項裁決對 AI 公司而言是一次部分勝利，確立了版權作品可以用於 AI 訓練的普遍原則。法院在權衡多項合理使用因素後，裁定 Anthropic 在訓練大型語言模型方面是合理的，因為其使用具有變革性且對市場影響甚微。相反，使用盜版副本建立通用圖書館的行為被認定為侵權，因為它缺乏變革性目的且並非合理必要。

法院的判決確立了一個先例，即使用版權材料訓練 AI 模型因其變革性質通常被視為合理使用。然而，判決明確劃定了資料來源的界限，裁定獲取並保留「盜版」副本以建立中央圖書館（即使其中一部分用於訓練）不屬於合理使用，並可能導致法律責任。此裁決並未就 AI 輸出是否構成侵權或合理使用給出明確答案，並暗示直接使用盜版副本進行訓練也可能不屬於合理使用，儘管這一點尚未最終裁定。

依據此判決，在公司開發和訓練 AI 模型時，應注意以下幾點：

AI 模型訓練的合法性： 法院支持將版權作品用於 AI 模型訓練，認為這屬於「合理使用」，因為其具有「極具變革性」的本質。這意味著在合法取得原始資料的情況下，使用版權內容來訓練 AI 模型是受法律保護的。
資料來源的重要性： 判決的關鍵點在於資料來源的合法性。儘管訓練過程可能被視為合理使用，但若用於訓練或建立資料庫的版權作品是透過非法（如「盜版」）途徑取得，則可能構成侵權。因此，務必確保所有用於訓練 AI 的資料都來源合法，並符合版權規定。
避免建立「盜版」資料庫： 法院明確指出，即使部分內容用於訓練，建立和維護一個包含「盜版」版權作品的中央數位圖書館是不被允許的。這可能導致法律責任。建議公司對內部資料庫的版權合規性進行嚴格審查。
未來發展的關注： 此判決並未完全釐清 AI 產出本身的版權問題，以及直接使用盜版副本進行訓練是否絕對不屬於合理使用。建議持續關注相關法律判例和立法動態，以便隨時調整資料管理和 AI 開發策略。
版權盡職調查： 在採購、使用和管理資料時，應進行徹底的版權盡職調查，以避免潛在的法律風險。對於來源不確定的內容，應尋求法律意見。

此判決在 AI 產業版權合規方面提供了一個重要的指導框架，建議所有客戶仔細審視其現有操作，並在必要時尋求法律諮詢。

資料出處：District Court Issues AI Fair Use Decision: Using Copyrighted Works To Train AI Models Is Fair Use, but Using “Pirated” Copies To Build a Central Library Is Not

に 知的財産ニュース

# AI 人工智慧