偷資料後聘請厲害律師就穩了？AI侵權官司的真相

最近參與過電影《黑豹》、《復仇者聯盟》系列和《雷神索爾》系列的概念藝術家歐提茲（Karla Ortiz）領著創作社群一起提告 Stability AI，雖初步獲地方法官支持創作者繼續侵權訴訟，其實這場內容創作者與 AI 模型公司的戰役，要繼續贏仍有許多挑戰。為什麼？原因竟是科技圈的「暗黑」手法：先偷資料再請好律師，可能重現？

最近一連串與生成式AI相關訴訟案搬上檯面後，又造成全球創作人討論與擔憂。

Stability AI因圖像遭藝術家控告、Claude因歌詞被音樂出版商控告、OpenAI因文字被作家與媒體控告、GitHub因程式碼被開發者控告，類似訴訟在各地開展。

創作者控告Stability AI案件尤受關注，因不同於Getty Images這類圖庫公司控告Stability AI，而是由曾參與《黑豹》、《復仇者聯盟》和《雷神》等電影的概念藝術家歐提茲（Karla Ortiz）和其他創作者發起。

《The Hollywood Reporter》報導，上週美國地方法官歐瑞克（William Orrick）認同創作者部分論點，拒絕駁回控告Stability AI，支持創作者繼續侵權訴訟。

雖然法官沒有處理訓練模型是否屬合理使用議題，但歐瑞克認為，AI公司未經同意，便將藝術家創作存入系統，此舉侵犯後者權利。看來此案似乎法官展現支持創作者態度，但對創作者來說，與AI的戰役仍不容易打。為什麼？

首先，機器侵占任務的自動化焦慮（automation anxiety），已讓白領工作者戰戰兢兢。即便看似最不容易被AI挑戰的創作者，同樣無法置身事外。就像寫程式碼有GitHub Copilot、Codeium輔助，無論文字、圖像、聲音或影音，都有AI工具可用，文字有ChatGPT，圖像有Midjourney、音樂有sudo、影音也有Runway。

這些科技公司開發的AI工具，都是站在前人肩膀上，正是小說家、作曲家、畫家孜孜矻矻創作，作品流傳於世，OpenAI、Anthropic和Midjourney等才能用這些作品訓練模型。

AI是降低門檻的好工具，還是內容小偷？

對一般人來說，AI工具無疑是弭平創作門檻的福音，但對創作者來說，這卻是赤裸裸的偷竊，故2022年底生成式AI映入一般民眾眼簾後，創作者與AI公司戰火便全面燃起。

但舉證一點也不容易。他們要先從以億計的圖片資料庫，找到自己的作品，接著得鑽進技術討論之海，釐清深度學習（deep learning）究竟只是學走資料模式（pattern），還是真把創作化為權重，讓使用者有辦法透過咒語重製。最後，創作者還得跟法院解釋，為何圖像資料拿去訓練模型構成侵權，而不是辯方所說的合理使用。

歐瑞克認為，新創Stability AI開發文產圖（text-to-image）模型，接受使用者指令後，有辦法創造高度真實的圖像，這類AI創作大幅仰賴有版權的作品，且讓模型回應這類指令的意圖，開發工具就是促進侵權。

Stability AI利用LAION資料庫訓練模型，這資料庫並不直接儲存圖像，而是以圖像網址和描述的成對文字（pair）組合，對應兩者後，模型就能「理解」圖像的語意概念。舉例某張有大隊人馬參加馬拉松的照片，對應文字有可能是奔跑、馬拉松和人潮。

有開發者打造搜尋工具，讓藝術家確認自己創作是否被納入資料庫。LAION資料庫不直接儲存圖像，故創作怒火就集中用LAION打造服務的AI公司。

（Source：Stability AI ）

施密特：先偷資料再請律師處理

不只文產圖公司面臨訴訟，不同功能的模型代表對應資料，都可能是未經授權。從Google前執行長與董事長、大量投資AI新創的施密特（Eric Schmidt）近期發言，或許能一瞥為何科技新創要先斬後奏，未經同意便運用他人資料。

近期惹了許多非議的史丹佛大學演講，施密特指出大語言模型能力進步，有辦法將使用者文字化為行動，他舉例可向大語言模型下令，請它再現複製版TikTok（Make me a copy of TikTok），並「偷走用戶和音樂，加入我的偏好，接著在30秒內寫好程式碼。」

因大語言模型已從文字對話上升到處理多模態、成為AI代理人的潛力，無論打造網頁介面還是增加功能，大語言模型都能完成。施密特之後補救，發言重點不是非法竊取音樂，但如果是矽谷創業家，產品取得成功，就能找一群菁英律師收拾殘局。「但如果沒人用你的產品，那是否有偷內容也不重要了」。

單看施密特發言，或許能視為科技老兵的個人想法。但施密特不是普通的科技老兵，他投資開發Claude的Anthropic、打造Stable Diffusion的Stability AI，也著力開發AI基礎模型的新創Mistral AI、Inflection AI和French AI startup H等公司的重要投資人。

人工智慧模型商和創作者的戰爭，也讓人想到創作者與盜版者多年的搏鬥。開發者認為資料訓練模型為合理使用，且模性表現提升，不只對公司有益，從社會角度也能一起進步。故海盜黨（Pirate Party）也主張改革著作權，以促進社會福祉。

對創作者來說，正因有多年累積的品味、經驗和美學，方能做出獨樹一幟的風格，但AI工具商卻沒問過作者，就粗暴將作品收入資料庫，用來訓練模型，讓使用者用AI創作時，靈活調度各藝術家的風格。

對創作者來說，這場戰役仍很艱辛。

（本文由遠見雜誌授權轉載；首圖來源：shutterstock）

文章看完覺得有幫助，何不給我們一個鼓勵

請我們喝杯咖啡