僅需7張照片 任何人都能在這個世界上“無中生你”


註意看,這是一位小學老師,他正赤裸著上身在學校教室裡自拍。如果這是一張真實的照片,那麼圖片中這位名為John的小學老師很可能將被學校直接勒令開除。但好在,這位John是一個由ArtsTechnica為做人工智能社交圖片實驗而虛構出來的人物。


圖片來自Arts Technica網站,版權屬於原作者

John的人物設定是一位普通的小學老師,和我們生活中的大部分的人一樣,在過去的 12 年裡,John喜歡在 Facebook 上發佈自己在工作記錄、傢庭生活、假期照片等。

Arts Technica團隊通過從中選取7張含有John的圖片,再使用近期大火的Stable Diffusion和Google研究院發佈的Dreambooth兩個AIGC工具,接著就在社交媒體上生成不同版本、讓人真假難辨的John。

在這些照片裡,John從一位普通的、喜歡分享日常生活的英文老師,一會變成一個喜歡在教室裡、公眾場合脫衣服自拍的“危險分子”,一會又變成一個喜歡穿各種奇裝異服搞怪的“小醜”……翻看照片,每一張似乎都不是John,但每一張卻都有著John的臉。

而實際上,如今通過借助各種免費開放的AIGC工具,John的經歷可能會輕易地發生在我們每個普通人的身上。

當AIGC遇上真人

Arts Technica表示,一開始在計劃做這個實驗時,他們征集一些願意分享自己的社交媒體圖片來做AI實驗訓練的志願者,但由於生成出來的照片太真實、帶來的潛在名譽危害太大,讓他們最終放棄使用真人的照片,而是選擇先用AI生成一個虛擬的John。

實驗結果讓他們感覺到,在當前的技術環境下,我們每個普通人都處在一種潛在的危險之中。

整個實驗過程其實非常簡單:從社交媒體上拿到的7張有個人臉部圖像的圖片,再使用網上開源和免費的Stable Diffusion及Dreambooth的合成代碼,你就可以通過輸入一段描述性的語句,生成各種不同風格和不同場景下有關這個人的圖片。

比如網友們用馬斯克網上的公開照片作為訓練集,用它們生成的各種風格的圖片。


圖片來自於reddit

一些人也用維基百科的聯合創始人Jimmy Wales的公開照片進行訓練,把這個溫文爾雅的企業傢變成一位運動型的健美先生。


圖片來自於wikimedia公開文件

在這裡,首先要帶大傢快速回顧一下Stable Diffusion和Dreambooth的功能。

Stable Diffusion 是一個文字轉圖片的生成模型。可以隻用幾秒鐘時間就生成比同類技術分辨率、清晰度更高,更具“真實性”或“藝術性”的圖片結果。和其它同類型的AI生成圖片相比,Stable Diffusion 的生成結果更為寫實。

此外,Stable Diffusion還有一個重要特點就是其完全免費開源,所有代碼都在 GitHub 上公開,任何人都可以拷貝使用。也正是“寫實”和“開源”兩個特性,也讓它在DALL·E、Imagen 等封閉及半封閉同類產品中“殺”出一條道路。

Dreambooth則是來自於GoogleAI實驗室的一種新的從文本到圖像的“個性化”(可適應用戶特定的圖像生成需求)擴散模型。它的特點是,隻需幾張(通常 3~5 張)指定物體的照片和相應的類名(如“狗”)作為輸入,即可通過文字描述讓被指定物體出現在用戶想要生成的場景中。

比如你輸入一輛汽車圖片,就可以下指令毫不費力的改變它的顏色。你輸入一張松獅狗的照片,你可以在保留它的面部特點的情況下將它轉變成熊、熊貓、獅子等等,也可以讓它穿上不同的衣服出現在不同的場景之中。



本來呢,Stable Diffusion聚焦於用文本生成創意圖片,Dreambooth則聚焦於有條件限制地“改造”圖片,這兩個工具之間並沒有什麼直接的交集。但奈何廣大網友們的想象力和行動力都太過強大,他們把這兩個開源產品一搗鼓,很快就搞出一個可以將Stable Diffusion和Dreambooth結合使用的新工具。

在這個新的工具中,你可以使用Dreambooth的功能用任何幾張圖片作為訓練圖,在生成目標之後,再結合Stable Diffusion強大的文本轉化功能,就可以讓這個指定目標以任何你所想要描繪的形式出現。

娛樂之外,也打開“潘多拉魔盒”

在這個新玩法出現之後,網友們就像發現新大陸一般,開始紛紛嘗試改造自己的照片。

有人把自己化身為西部牛仔、有人走進中世紀的油畫、有人變成鐵血戰士等等……與此同時,各種關於教普通人如何使用Stable Diffusion+Dreambooth的工具的教程視頻、文章也開始在網上出現。


圖片截自於Youtuber James Cunliffe

然而,當大傢都在開心地po著自己的圖片,大誇技術有趣炫酷的同時,也有很多人開始關註到這個技術背後的隱藏的巨大風險。

相較於此前已經被討論得很多的“深度偽造(Deepfake)”技術來說,AIGC類工具讓偽造從“換臉”直接進化到“無中生有”的階段,也就是說,任何人通過一句話的描述就可以憑空“變出”一個你。此外,“偽造”技術的門檻也變得更低,跟著一個Youtube視頻學個10分鐘,沒有技術背景的小白也可以輕松掌握。

據統計,目前全世界有超過 40 億人使用社交媒體,如果你曾在社交媒體平臺上公開上傳過自己的照片,那麼一旦有人產生不良的動機,就將很容易地使用這些的圖片進行造假和濫用。最後的結果可能是一張暴力照片、一張不雅照、一張侮辱性的照片,而這些照片則將能輕易地被用於栽贓嫁禍、校園霸凌、造謠傷害等各種灰暗的場景之中。

目前,從Stable Diffusion目前的生成圖片來看,如果仔細觀察還是比較容易分辨出人物的真假。但問題在於,鑒於最近幾年來AIGC技術的進步非常迅速,人們或許將可能很快就無法用肉眼分辨生成照片和真實照片之間的區別。


加強版的Stable Diffusion圖片,來自於Twitter用戶Roope Rainisto

而且,即使就是一張經不起推敲的照片,但傳遞的負面信息其對一個人的破壞力也可能是驚人的。比如。若真的有文章開頭這位名為John的小學老師,當有人看到他在教室裡或者其他不雅照時,無論真假,很可能僅僅是一個懷疑或者是謠言,就能毀掉他的聲譽和事業。

這就像是丹麥電影《狩獵》裡演的一樣,即使最後證明小女孩對男教師的猥褻指控都是編造的,但由傳言所帶來的惡意依然在男教師的生活中如影隨形。

嘗試用“魔法打敗魔法

其實對於AIGC技術,開發人員們也早已意識到其可能帶來的危害。比如當Google宣佈推出Imagen、Dreambooth時,在解釋文檔中都避免使用真人的照片,而是用物品和可愛的動物的圖片舉例進行說明。

不僅是Google,DallE等同類工具也無一不是如此。對此,麻省理工評論曾對這種轉移公眾視線的做法進行強烈質疑。他們在文中寫道:“我們隻看到各種可愛的圖像,但看不到任何包含仇恨、刻板印象、種族主義、暴力、性別歧視的畫面。但即使不說,我們也清楚的知道,它們就在那裡。”

目前,針對這個問題,很多平臺也在嘗試著用各種方法解決。其中,OpenAI和Google等一些平臺的解決辦法是將工具關在籠子裡,僅開放給少數受信任的用戶使用;Stability AI 在最新發佈的 2.0 版本的訓練數據集中刪除大部分含有不良信息的數據,同時在軟件許可協議中明確規定不允許創建人物圖像。

但政策性的規定畢竟指標不治本,近期,包括Stable Diffusion在內的一些平臺也在嘗試使用技術手段解決這個問題,其中包括“不可見水印”技術。通過這種人眼看不到的水印,系統將能夠自動識別圖片的真假,同時能對圖片的編輯和再生成進行保護。

此外,針對訓練的源頭——原始圖片保護上,上個月,MIT的研究人員宣佈開發一項過專門針對AI照片編輯的 PhotoGuard 技術,用以阻止 AI 使用某些圖像接受訓練。比如同樣的一張肉眼看不出區別的照片,使用PhotoGuard技術之後,AI便無法從中提取到足夠的有效信息。


圖片來自gradientscience

最近一兩年來,AIGC的技術突飛猛進,一大批圖像生成工具和ChatGPT的爆火出圈,讓大傢意識到老生常談的人工智能時代這次似乎真的已經在拐角。

不久前Stable Diffusion的研究人員就曾表示,Stable Diffusion 將很可能在一年之內就在智能手機上運行。很多同類工具也都開始著手在更輕量化的設備上訓練這些模型,比如目前ChatGPT的各種插件已經開始被用戶廣泛使用。因此人們可能很快就會看到,由人工智能推動的創意產出將在未來幾年出現爆炸式增長。

但隨著AIGC走向公眾化、平民化,深度合成內容制作的技術門檻越來越低,普通人僅需要少量的圖像、音頻、視頻、文本等樣本數據,就能夠模糊信息真實和虛假的邊界。在沒有出臺相關法律規范的前提下,技術一旦被濫用,將會給個人、企業造成巨大風險與實質性危害。

自從今年AI繪畫類工具爆火以來,很多人把目光放在AI對於藝術創作的顛覆上,但實際上,AI不僅是改變創作模式,而是可能也對社會秩序發起挑戰。有條件地限制AI的能力,這也可能是在讓AIGC改變我們的生活之前,必須要首先解決的問題。


相關推薦

2024-05-12

一張照片,幾秒鐘,就能還原出你在黏土世界的樣子。就是這麼一個抽象的濾鏡,最近在網上火,這兩天相關的帖子,在的抖音小紅書首頁就沒停過……而搞出這個黏土AI的,是個叫Remini的軟件,秉著打不過就加入的心態,我們

2022-08-27

打哪”的能力,會變得有多強?隻需上傳3-5張指定物體的照片,再用文字描述想要生成的背景、動作或表情,就能讓指定物體“閃現”到你想要的場景中,動作表情也都栩栩如生。不止是動物,其他物體像墨鏡、書包、花瓶,也

2022-08-16

他曾經看到馬斯克不知不覺地在一張桌子上睡著,就拍張照片。馬斯克在特斯拉工廠“我拍這張照片,心想,‘哦,天哪,你會因此被解雇的’。然後,我就刪除這張照片。”梅德洛克說。他補充稱,馬斯克在辦公室裡的舉止不

2022-09-14

頭往往都是面對公共空間拍攝,並且經常提供在線直播給任何人訪問,其中就包括美國時代廣場、芝加哥箭牌球場和愛爾蘭都柏林的聖殿酒吧等地標性景點。其次,它選取從這些攝像頭覆蓋的位置發佈的Instagram照片,並對照片裡

2024-03-19

馬斯克還活著,而且非常活躍(因此還在派發名片),卻能在這份向所有擁有名片的人開放的榜單上占有一席之地,這實在令人吃驚。阿爾伯特-愛因斯坦的紀念品在拍賣會上極為珍貴。20 年來,我們一直在報道愛因斯坦紀念品

2023-11-26

會展上,美國谷歌公司的人工智能對一張美國登月的任務照片進行數據分析。結果,用紅色標註出該人工智能認為可能造假的部分,最後這張照片幾乎每個部分都被標註上鮮艷的紅色,這表示美國谷歌的人工智能分析認為:這張

2024-05-12

有點恐怖。現在,AI隻需隨意一張照片,就能知道你在哪裡,而且是可以精確到經緯度的那種!例如下面這張隨便到不能再隨便的自拍,你能猜到小姐姐在哪裡嗎?這事交給現在的AI來處理,它隻需要“看”一眼,就能把照片裡

2023-03-11

還是個不用註冊、不限次數,登上網站就能用的小工具,任何人都可以愉快的直接在他們的官網上使用。可惜的是由於網站資源有限,經常會遇到排隊的情況,有時候排隊好幾個小時才能用上的情況也經常發生。我在經歷漫長的

2022-06-30

真。不管是短短幾個字,還是五十多個個單詞的小段落,都能清晰展現出來。比如,The back of a violin,小提琴的背面。亦或是照著梵高《星空》來描述的夜晚畫面。ps,這段有 67 個單詞。結果 Parti 也不在話下,一攬子把各種風格

2023-12-04

力的工作領域將會被顛覆,我們將看到AIGC在所有領域中都能與人類的智力工作者媲美,這意味著,所有的工作都將發生變化,沒有一個工作將不受影響。醫療行業放射學、皮膚癌等許多領域中的診斷AI系統,能夠在人們發現癥狀

2023-11-27

在數碼攝影、修圖軟件和AI當道的今天,想要對一張照片進行調色,美顏,甚至是PS合成都是那麼的輕而易舉。然而,在一百年多前,攝影技術剛剛興起,還沒有數碼相機和PS的年代,就有數十張震驚全世界的黑白老照片,最後被

2022-09-29

車間的“兔子服”:圖片來源:矽星人 via 英特爾在這張照片被拍下的10分鐘前,我剛剛從英特爾以色列 Fab 28 晶圓工廠出來。這傢可以和“芯片技術創新”劃等號的全球頂級半導體公司,在前不久終於對來自十多個國傢的分析師

2022-06-28

屏幕上的通知)以及部分輕量級個性化(你的伴侶或貓的照片)的目的地。但兩年前,蘋果在iOS14裡面對iPhone的主屏做出的個性化改變(定制小組件與app圖標共享屏幕)為更大的鎖屏變更奠定瞭基礎。費德裡吉說:“我們知道這

2023-01-23

短缺大多發生在這些更成熟的工藝中。臺積電的主要客戶都能在7納米工藝中獲得他們所需的大部分產能,但對於工業和汽車客戶來說,高不成低不就確實非常痛苦。這些公司需要像微控制器(MCU)和電源管理集成電路(PMIC)這