OpenAI遭紐約時報起訴,法官下令交ChatGPT對話紀錄

在生成式 AI 應用大爆發後,多起版權訴訟戰開打,究竟 AI 公司怎樣訓練數據是合理使用(Fair Use),怎樣會涉及侵權,成為 AI 與內容產業關注的焦點。

最近《紐約時報》與 OpenAI 的官司,迎來對前者暫時有利的裁決。據《路透社》報導,聯邦治安法官 Ona T. Wang 下令 OpenAI,必須在嚴格的保護框架下,向《紐約時報》及其他原告提交約 2,000 萬筆,經過「去識別化」處理的 ChatGPT 對話紀錄。

OpenAI 之前企圖駁回該要求,稱其違反 ChatGPT 隱私政策,恐讓用戶權利受損。

圖源:OpenAI

但法官在裁決書中明確指出,法官認可 OpenAI 對用戶隱私的真誠考量,但在法律的比例原則分析中,隱私僅是考量因素之一。

法官強調,在案件具備明確相關性且對公司造成的負擔極小的情況下,隱私考量不能凌駕於真相之上。

為了最小化侵犯用戶隱私影響,法官也指出這些 ChatGPT 對話紀錄,將僅供律師查閱,以作為額外的隱私保護層,協助原告驗證 ChatGPT 的輸出內容,是否重製了《紐約時報》的作品。

OpenAI堅稱,AI訓練是合理使用

回顧這起訴訟,《紐約時報》在 2023 年 12 月正式起訴 OpenAI,指控其未經授權使用受版權保護的新聞內容,來訓練 AI 模型。

在訴訟交鋒中,《紐約時報》向法官訴求,OpenAI 應交出 ChatGPT 對話紀錄,以查證是否涉及侵權。

OpenAI 曾以保護用戶隱私為由而強烈反對,堅稱使用網路上公開發布的出版商內容來訓練 ChatGPT 模型,符合美國版權法的合理使用(Fair Use)原則。

圖源:Heute免費圖庫

媒體堅稱,OpenAI竊取新聞工作者成果

如今法官下令 OpenAI 交出對話紀錄,也為原告方開了一條透明檢視證據的路。

MediaNews Group 和 Tribune Publishing 的執行編輯 Frank Pine 就痛批:「如果 OpenAI 領導層以為,可以藉此隱瞞其商業模式的證據,即仰賴竊取辛苦工作的記者成果,那簡直是出現幻覺。」

Pine 進一步抨擊:「他們應為旗下產品涉及受版權保護作品的部分付費,而且他們心知肚明。」

原告律師認為,在 OpenAI 交出 ChatGPT 對話紀錄,對於判定該公司是否重製版權內容至關重要,同時也能反駁 OpenAI 指控媒體是誘導 ChatGPT 產生特定回應的說法。

紐時、OpenAI訴訟案,或為AI訓練提供標準

這起案件的結果,不只是單一訴訟的勝負,甚至可能會重塑 OpenAI、Anthropic 和 Perplexity 等生成式 AI 公司未來獲取訓練數據、授權內容的方式,以及如何在輸出內容方面建立防護機制。

目前,包括作家、新聞機構、音樂出版商和程式碼庫在內的多方版權持有者,正對各大 AI 公司發起一波又一波的版權挑戰。

日前,Anthropic 非法下載版權書籍做訓練的部分,已被法院判定侵權,而合法購買來訓練的書籍則被視為合理使用;生成式 AI 公司 Udio 則與華納、環球音樂和解,因此關於透過自動化工具,從 YouTube 下載大量版權音樂的部分,是否為合理使用,尚無可參考判例。

各界都在密切關注,現行的版權法規在面對 AI 模型攝取並重製受保護素材時,其法律邊界將如何被重新定義。

延伸閱讀:
Sora 2版權爭議》日本政府要求OpenAI勿侵權:動漫是我國無價之寶

集英社新人漫畫獎作品疑用AI生成!日本網友大炎上:難道評審看不出來?

『紐時告OpenAI迎轉捩點!法官下令交出2千萬筆ChatGPT對話紀錄』這篇文章最早發佈於『加密城市』