註意看,這是一位小學老師,他正赤裸著上身在學校教室裡自拍。如果這是一張真實的照片,那麼圖片中這位名為John的小學老師很可能將被學校直接勒令開除。但好在,這位John是一個由ArtsTechnica為做人工智能社交圖片實驗而虛構出來的人物。
圖片來自Arts Technica網站,版權屬於原作者
John的人物設定是一位普通的小學老師,和我們生活中的大部分的人一樣,在過去的 12 年裡,John喜歡在 Facebook 上發佈自己在工作記錄、傢庭生活、假期照片等。
Arts Technica團隊通過從中選取7張含有John的圖片,再使用近期大火的Stable Diffusion和Google研究院發佈的Dreambooth兩個AIGC工具,接著就在社交媒體上生成不同版本、讓人真假難辨的John。
在這些照片裡,John從一位普通的、喜歡分享日常生活的英文老師,一會變成一個喜歡在教室裡、公眾場合脫衣服自拍的“危險分子”,一會又變成一個喜歡穿各種奇裝異服搞怪的“小醜”……翻看照片,每一張似乎都不是John,但每一張卻都有著John的臉。
而實際上,如今通過借助各種免費開放的AIGC工具,John的經歷可能會輕易地發生在我們每個普通人的身上。
當AIGC遇上真人
Arts Technica表示,一開始在計劃做這個實驗時,他們征集一些願意分享自己的社交媒體圖片來做AI實驗訓練的志願者,但由於生成出來的照片太真實、帶來的潛在名譽危害太大,讓他們最終放棄使用真人的照片,而是選擇先用AI生成一個虛擬的John。
實驗結果讓他們感覺到,在當前的技術環境下,我們每個普通人都處在一種潛在的危險之中。
整個實驗過程其實非常簡單:從社交媒體上拿到的7張有個人臉部圖像的圖片,再使用網上開源和免費的Stable Diffusion及Dreambooth的合成代碼,你就可以通過輸入一段描述性的語句,生成各種不同風格和不同場景下有關這個人的圖片。
比如網友們用馬斯克網上的公開照片作為訓練集,用它們生成的各種風格的圖片。
圖片來自於reddit
一些人也用維基百科的聯合創始人Jimmy Wales的公開照片進行訓練,把這個溫文爾雅的企業傢變成一位運動型的健美先生。
圖片來自於wikimedia公開文件
在這裡,首先要帶大傢快速回顧一下Stable Diffusion和Dreambooth的功能。
Stable Diffusion 是一個文字轉圖片的生成模型。可以隻用幾秒鐘時間就生成比同類技術分辨率、清晰度更高,更具“真實性”或“藝術性”的圖片結果。和其它同類型的AI生成圖片相比,Stable Diffusion 的生成結果更為寫實。
此外,Stable Diffusion還有一個重要特點就是其完全免費開源,所有代碼都在 GitHub 上公開,任何人都可以拷貝使用。也正是“寫實”和“開源”兩個特性,也讓它在DALL·E、Imagen 等封閉及半封閉同類產品中“殺”出一條道路。
Dreambooth則是來自於GoogleAI實驗室的一種新的從文本到圖像的“個性化”(可適應用戶特定的圖像生成需求)擴散模型。它的特點是,隻需幾張(通常 3~5 張)指定物體的照片和相應的類名(如“狗”)作為輸入,即可通過文字描述讓被指定物體出現在用戶想要生成的場景中。
比如你輸入一輛汽車圖片,就可以下指令毫不費力的改變它的顏色。你輸入一張松獅狗的照片,你可以在保留它的面部特點的情況下將它轉變成熊、熊貓、獅子等等,也可以讓它穿上不同的衣服出現在不同的場景之中。
本來呢,Stable Diffusion聚焦於用文本生成創意圖片,Dreambooth則聚焦於有條件限制地“改造”圖片,這兩個工具之間並沒有什麼直接的交集。但奈何廣大網友們的想象力和行動力都太過強大,他們把這兩個開源產品一搗鼓,很快就搞出一個可以將Stable Diffusion和Dreambooth結合使用的新工具。
在這個新的工具中,你可以使用Dreambooth的功能用任何幾張圖片作為訓練圖,在生成目標之後,再結合Stable Diffusion強大的文本轉化功能,就可以讓這個指定目標以任何你所想要描繪的形式出現。
娛樂之外,也打開“潘多拉魔盒”
在這個新玩法出現之後,網友們就像發現新大陸一般,開始紛紛嘗試改造自己的照片。
有人把自己化身為西部牛仔、有人走進中世紀的油畫、有人變成鐵血戰士等等……與此同時,各種關於教普通人如何使用Stable Diffusion+Dreambooth的工具的教程視頻、文章也開始在網上出現。
圖片截自於Youtuber James Cunliffe
然而,當大傢都在開心地po著自己的圖片,大誇技術有趣炫酷的同時,也有很多人開始關註到這個技術背後的隱藏的巨大風險。
相較於此前已經被討論得很多的“深度偽造(Deepfake)”技術來說,AIGC類工具讓偽造從“換臉”直接進化到“無中生有”的階段,也就是說,任何人通過一句話的描述就可以憑空“變出”一個你。此外,“偽造”技術的門檻也變得更低,跟著一個Youtube視頻學個10分鐘,沒有技術背景的小白也可以輕松掌握。
據統計,目前全世界有超過 40 億人使用社交媒體,如果你曾在社交媒體平臺上公開上傳過自己的照片,那麼一旦有人產生不良的動機,就將很容易地使用這些的圖片進行造假和濫用。最後的結果可能是一張暴力照片、一張不雅照、一張侮辱性的照片,而這些照片則將能輕易地被用於栽贓嫁禍、校園霸凌、造謠傷害等各種灰暗的場景之中。
目前,從Stable Diffusion目前的生成圖片來看,如果仔細觀察還是比較容易分辨出人物的真假。但問題在於,鑒於最近幾年來AIGC技術的進步非常迅速,人們或許將可能很快就無法用肉眼分辨生成照片和真實照片之間的區別。
加強版的Stable Diffusion圖片,來自於Twitter用戶Roope Rainisto
而且,即使就是一張經不起推敲的照片,但傳遞的負面信息其對一個人的破壞力也可能是驚人的。比如。若真的有文章開頭這位名為John的小學老師,當有人看到他在教室裡或者其他不雅照時,無論真假,很可能僅僅是一個懷疑或者是謠言,就能毀掉他的聲譽和事業。
這就像是丹麥電影《狩獵》裡演的一樣,即使最後證明小女孩對男教師的猥褻指控都是編造的,但由傳言所帶來的惡意依然在男教師的生活中如影隨形。
嘗試用“魔法打敗魔法
其實對於AIGC技術,開發人員們也早已意識到其可能帶來的危害。比如當Google宣佈推出Imagen、Dreambooth時,在解釋文檔中都避免使用真人的照片,而是用物品和可愛的動物的圖片舉例進行說明。
不僅是Google,DallE等同類工具也無一不是如此。對此,麻省理工評論曾對這種轉移公眾視線的做法進行強烈質疑。他們在文中寫道:“我們隻看到各種可愛的圖像,但看不到任何包含仇恨、刻板印象、種族主義、暴力、性別歧視的畫面。但即使不說,我們也清楚的知道,它們就在那裡。”
目前,針對這個問題,很多平臺也在嘗試著用各種方法解決。其中,OpenAI和Google等一些平臺的解決辦法是將工具關在籠子裡,僅開放給少數受信任的用戶使用;Stability AI 在最新發佈的 2.0 版本的訓練數據集中刪除大部分含有不良信息的數據,同時在軟件許可協議中明確規定不允許創建人物圖像。
但政策性的規定畢竟指標不治本,近期,包括Stable Diffusion在內的一些平臺也在嘗試使用技術手段解決這個問題,其中包括“不可見水印”技術。通過這種人眼看不到的水印,系統將能夠自動識別圖片的真假,同時能對圖片的編輯和再生成進行保護。
此外,針對訓練的源頭——原始圖片保護上,上個月,MIT的研究人員宣佈開發一項過專門針對AI照片編輯的 PhotoGuard 技術,用以阻止 AI 使用某些圖像接受訓練。比如同樣的一張肉眼看不出區別的照片,使用PhotoGuard技術之後,AI便無法從中提取到足夠的有效信息。
圖片來自gradientscience
最近一兩年來,AIGC的技術突飛猛進,一大批圖像生成工具和ChatGPT的爆火出圈,讓大傢意識到老生常談的人工智能時代這次似乎真的已經在拐角。
不久前Stable Diffusion的研究人員就曾表示,Stable Diffusion 將很可能在一年之內就在智能手機上運行。很多同類工具也都開始著手在更輕量化的設備上訓練這些模型,比如目前ChatGPT的各種插件已經開始被用戶廣泛使用。因此人們可能很快就會看到,由人工智能推動的創意產出將在未來幾年出現爆炸式增長。
但隨著AIGC走向公眾化、平民化,深度合成內容制作的技術門檻越來越低,普通人僅需要少量的圖像、音頻、視頻、文本等樣本數據,就能夠模糊信息真實和虛假的邊界。在沒有出臺相關法律規范的前提下,技術一旦被濫用,將會給個人、企業造成巨大風險與實質性危害。
自從今年AI繪畫類工具爆火以來,很多人把目光放在AI對於藝術創作的顛覆上,但實際上,AI不僅是改變創作模式,而是可能也對社會秩序發起挑戰。有條件地限制AI的能力,這也可能是在讓AIGC改變我們的生活之前,必須要首先解決的問題。