凱利·麥柯南(KellyMcKernan)是一位36歲的美國田納西州納什維爾藝術傢,她在去年用水彩顏料和丙烯顏料為書籍、漫畫和遊戲創作大量的原創插畫,並在“HaveIBeenTrained”這個網站上輸入這些作品的名字。
也就是在那個時候,她發現自己的一些作品被用來訓練 Stable Diffusion,這是一種免費的人工智能模型,任何人都可以通過簡單的文字提示就能生成專業品質的圖像。Stable Diffusion 支持幾十個流行的應用,如 Lensa。
12 月份,麥柯南寫一條推文,說:“起初,這很令人興奮,也很超現實。”後來這條推文在Twitter上瘋傳。
不過,這個興奮隻持續一瞬。麥柯南發現,任何使用 Stable Diffusion 的人,隻需輸入她的名字,就能生成具有她的風格的作品。而且從來沒有人找過她尋求授權或給予補償。
“這項技術毀掉當今最有才華、最有激情的在世藝術傢的整個職業道路,”麥柯南告訴 BuzzFeed News,她是一位單身母親,目前正在為搖滾樂隊 Evanesence 創作一部漫畫小說選集。“這種技術發展使像我這樣的獨立藝術傢更加匱乏。”
上周,麥柯南成為集體訴訟的三名原告之一,起訴對象包括:Stability AI 是一傢總部位於倫敦的公司,該公司與他人共同開發 Stable Diffusion;Midjourney,一傢位於舊金山的初創公司,使用 Stable Diffusion 為基於文本的圖像創建提供支持;DeviantArt 是一傢藝術傢在線社區,現在提供自己的 Stable Diffusion 驅動的生成器,稱為 DreamUp。
這起訴訟是由律師馬修·巴特裡克(Matthew Butterick)與約瑟夫·薩維裡(Joseph Saveri)律師事務所一起在舊金山提起的,這支團隊目前正在起訴微軟、GitHub 和 OpenAI(ChatGPT 和圖像生成器 DALL-E 2 的創建者),因為他們在網上提供 Copilot,這是一種自動代碼生成器,在未經編寫代碼的工程師許可的情況下,根據現有代碼進行訓練。人工智能藝術訴訟案的另外兩名原告分別是 30 歲的俄勒岡州漫畫傢薩拉·安德森(Sarah Andersen)和 37 歲的舊金山插畫師卡拉·奧爾蒂斯(Karla Ortiz)。
鉛筆畫,作者:卡拉·奧爾蒂斯
這起訴訟聲稱,Stable Diffusion 是在未經許可的情況下,從互聯網上收集數十億張圖像上進行訓練,包括這三位藝術傢所擁有的圖像。薩維裡在一份新聞稿中表示,如果放任由生成式人工智能產品驅動的產品和服務運營,“可以預見的後果就是,它們將取代那些與之競爭的藝術傢,而這些藝術傢的被盜作品恰恰為這些人工智能產品提供動力。”
奧爾蒂斯是一位概念插畫師,曾參與過電子遊戲和《侏羅紀世界》(Jurassic World)、《奇異博士》(Dr. Strange)等好萊塢大片的制作。她告訴 BuzzFeed News,藝術創作是“她快樂的地方”。她還說自己對科技很著迷。
2021 年初,奧爾蒂斯無意中發現早期的文本到圖像的人工智能生成器 DiscoDiffusion,並發現該工具能夠以她的風格以及她認識的其他藝術傢的風格生成圖像。“這是一種我從未有過的侵犯感,”她說。
出於擔憂,她開始與 Concept Artists Association(概念藝術傢協會)一起就此事召開會議。Concept Artists Association 是一傢為娛樂業藝術傢服務的組織,她在該組織擔任董事會成員。她還聯系機器學習專傢,以便更好地解這項技術,並且與其他藝術傢進行交流。11 月,她看到有關 Copilot 訴訟的新聞,並聯系薩維裡,為訴訟做好準備,組織同意。
去年 12 月,奧爾蒂斯看到麥柯南那條被瘋轉的推文,是關於生成式人工智能的;以及安德森在《紐約時報》(The New York Times)上發表的一篇評論文章,文中談到 4chan 上的另類右翼分子如何模仿她的藝術風格,創作親納粹的連環漫畫。她馬上與這兩個人取得聯系,她們都同意和她一起參與訴訟。
安德森通過電子郵件告訴 BuzzFeed News:“藝術傢有權說出他們辛苦創作的作品的命運。我們可以很明顯地看到,人工智能生成器的推出從來沒有考慮過藝術傢、我們的願望或我們的權利,而這是我們發表意見的唯一選擇。”
Concept Artists Association 目前正在籌款聘請遊說客,以保護創作者免受生成式人工智能的影響。
“這惡心死我,”奧爾蒂斯談到人工智能應用和服務時說,這些應用和服務可以根據文本提示立即生成藝術作品。“他們用我們的作品訓練這些模型。他們剝奪我們決定是否參與其中的權利。”
世界各地的藝術傢都表示擔心人工智能技術會讓他們變得多餘。在去年 12 月,當網上出現人工智能生成的藝術作品後,數百名藝術傢向互聯網上最大的藝術社區之一 ArtStation 上傳一張圖片,表示“對人工智能生成的圖像說不”(No to AI Generated Images)。數月之前,在科羅拉多州博覽會(Colorado State Fair)為新興數字藝術傢舉辦的年度藝術競賽將頭等獎授予一名使用 Midjourney 創作的參賽者後,引起藝術界的一片嘩然。
但是,上周,藝術傢們對 Midjourney 的 Stable Diffusion 和 DeviantArt 提起訴訟,這是藝術傢們首次在法庭上控告生成式人工智能公司。在提起訴訟幾天後,圖片交易巨頭蓋蒂圖像公司(Getty Images)也在倫敦對 Stability AI 提起訴訟,稱該公司“非法復制和處理數百萬受版權和相關元數據保護的圖像”,以訓練其人工智能模型。
Midjourney 和 DeviantArt 沒有回應 BuzzFeed News 對訴訟的置評請求。Stability AI 發言人表示,該公司仍在等待蓋蒂圖像公司的法律文件。至於這三位藝術傢的訴訟,發言人稱,“誰要是覺得這是不合理應用,那就是不懂科技,而且對法律也有誤解。”
專傢表示,這兩起訴訟的結果都將對人工智能生成的藝術品的未來以及創作者產生深遠的影響。
“如果藝術傢或蓋蒂圖像公司能夠獲得廣泛的勝利,這將大大削弱 Stable Diffusion 等工具的可行性,”哈佛法學院法律講師、哈佛大學伯克曼克萊恩互聯網及社會研究中心(Berkman Klein Center for Internet & Society)的網絡法律診所副主任傑西卡·費約德(Jessica Fjeld)表示,“另一方面,如果 Stable Diffusion 獲勝,並且這些使用被認定為非侵權,要麼是因為沒有復制或衍生作品,要麼是因為這是合理使用,藝術傢將失去進入潛在有價值的許可市場的機會。”
藝術傢和蓋蒂圖像公司的訴訟都指稱,被告在網絡上抓取的圖片上訓練其人工智能模型,違反版權法。不過,在過去,為訓練數據集抓取圖像或其他內容在美國版權法中被視為“合理使用”。2016 年,最高法院駁回作傢們的上訴,他們起訴Google掃描 2000 多萬本受版權保護的書籍並為其Google圖書(Google Book)網站建立索引。
作者:麥柯南
但生成式人工智能仍然是一項新生技術,它是根據從原始材料中學到的東西創造自己的輸出,到目前為止,還沒有法院對其進行裁決。費約德稱:“很難預測生成式人工智能領域的版權侵權案件會有什麼結果,因為這項技術還沒有得到很好的理解。”
生成式人工智能公司的首席執行官們並沒有回避談論圍繞他們正在推動的技術的問題。在接受《福佈斯》(Forbes)采訪時,Midjourney 首席執行官大衛·霍爾茨(David Holz)表示,該公司訓練其人工智能模型的數據集“隻是互聯網的一大塊碎片”,而且該公司並未征求擁有其作品版權的藝術傢的同意。“實際上並沒有辦法獲得一億張圖片,並且知道它們來自哪裡,”霍爾茲說。
同時,Stability AI 首席執行官伊瑪德·莫斯塔克(Emad Mostaque)告訴美國有線電視新聞網(CNN),在 LAION-5B 中,藝術作品的占比“遠低於 0.1%”。LAION-5B 指的是非營利組織 LAION 從網上搜集的近 60 億張圖片的數據集,這些圖片又被用來訓練 Stable Diffusion。(Stability AI 為該非營利性組織提供部分資金。)
“這仍然是數以百萬計的圖像,”溫哥華的概念藝術傢喬恩·蘭(Joe Lam)指出,他並未參與這三人的訴訟。“這就是數百萬張受版權保護的圖片,這些圖片就是你用來訓練人工智能的。”
上個月,Stability AI 宣佈,擔心自己的藝術被用於訓練人工智能模型的藝術傢可以選擇退出下一版本的 Stable Diffusion,這一聲明引起藝術傢的強烈反對,他們認為默認設置應該是“選擇加入”。莫斯塔克承認這是一個“復雜的問題”,並表示未來的 Stable Diffusion 模型將在“完全許可”的圖像上進行訓練。
一些觀察傢批評說,藝術傢們的訴訟有幾處錯誤。例如,該訴訟將“Stable Diffusion”描述為一個“一種拼貼工具,它將數百萬藝術傢的版權作品重新混合在一起,這些藝術傢的作品被用作訓練數據。”它還聲稱,人工智能藝術模型“儲存 [受版權保護的] 訓練圖像的壓縮副本。”
這兩種說法都存在爭議。在圖像上訓練的人工智能藝術模型包含模型從圖像中學到的“模式”,然後將其存儲為數字模型參數。一旦用戶輸入提示,模型就會根據這一數學公式並在文本的指引下,從頭生成自己的圖像。
(如果你想深入解,這裡有一個為數學愛好者提供的解釋,還有一個為不懂數學的人提供的更簡單的解釋。)
“[藝術傢] 聲稱 [Stable Diffusion 的運作方式] 是對復制權的額外侵犯,”費約德說,“但我完全不確定他們的說法是否正確。如果算法捕捉的是關於圖像的數據,那麼就很難被解釋為復制。創造衍生作品的權利將涉及輸出:它們是否以可識別的方式類似於或借鑒於源作品?”
薩拉·安德森創作的漫畫
但也有人認為,法律挑戰,盡管存在著諸多漏洞,但對於人工智能公司來說,“仍然是個麻煩”。為創意產業設計軟件的歐洲公司 Creative.ai 的創始人亞歷克斯·尚潘達德(Alex Champandard)在Twitter上說:“隻要那些公司為自己辯解,就會被拿來攻擊他們。”如果看起來 [被告] 會敗訴,或者如果這意味著有罪的證據最終會被記錄在案,那麼它可能會在庭外達成和解。”
有人質疑,為什麼這三位藝術傢的起訴對象沒有包括 OpenAI,OpenAI 的 DALL-E 2 圖像生成器去年在互聯網上引起轟動。薩維裡代表藝術傢的律師之一特拉維斯·曼弗雷德(Travis Manfredi)告訴 BuzzFeed News,該公司之所以排除 OpenAI,是因為 DALL-E 2 沒有使用 Stable Diffusion。“我們沒有那麼多關於他們訓練數據集的信息,因為他們沒有使用 LAION。”他說。當被問及該公司為什麼不起訴 LAION 時,曼弗雷德說,他們“還在調查 Stability AI 和 LAION 之間關系的全部性質。”
同時,還有一些巨頭要對付。自從訴訟的消息公開後,麥柯南的收件箱就被來自“人工智能兄弟”的仇恨郵件所淹沒。他們中的一些人稱麥柯南和其他像他們一樣的藝術傢為“盧德主義者”。有些人說,人工智能將取代他們,讓他們去找“真正的工作”。還有人說,他們的作品本來就不是原創,輸給人工智能是活該。
譯註:盧德主義者(Luddite),是 19 世紀英國民間對抗工業革命、反對紡織工業化的社會運動者。在該運動中,常常發生毀壞紡織機的事件。這是因為工業革命運用機器大量取代人力勞作,使許多手工工人失業。後世也將反對任何新科技的人稱做盧德主義者。1779 年英國萊斯特一帶一名名叫內德‧盧德(Ned Ludd)的織佈工曾怒砸兩臺織佈機,後人以訛傳訛成所謂盧德將軍或盧德王領導反抗工業化的運動,遂得此名。
“他們這是毫無意義的咆哮,”麥柯南說。“我壓根就不看這些郵件。這是浪費我的時間。他們聽起來就像剛學會走路的孩子,因為他們的新玩具受到威脅而生氣。”