隻憑DNA就還原出罪犯的長相,還是3D版的?沒錯,隻需要一個AI模型,就能還原出這人的年齡、膚色、瞳色、甚至整個3D頭像……即使在此之前,沒有任何人目擊過這個嫌疑犯也沒關系,用它合成的照片直接就能發佈通緝令。
據提供這項技術的公司介紹,他們之前用這種手段合成過一張照片,最後捉到的嫌犯和照片中長得幾乎一模一樣。
聽起來不僅高科技,甚至有點魔幻。
消息一出,不少網友聞訊趕來圍觀,但他們很快發現不對勁的地方。
從這傢公司其他的 DNA 表型分析照片來看,嫌犯和照片長得比較像,更多情況下是一種“巧合”。
他們還扒出這傢公司之前發佈過的一張罪犯照片,兩人除性別以外,可以說是長得毫不相幹……
那麼這種技術,真的能用在罪犯通緝這麼嚴肅的事情上嗎?
一個備受爭議的例子
事情還要追溯到 2019 年冬天的一個凌晨,加拿大埃德蒙頓警察局接到一個報警電話。
一位 20 多歲的女性被強奸後丟在路邊,全身隻有一件襯衫。
那天的氣溫接近零下 20 多度,她一度被凍得失去知覺,因此凌晨 5 點多醒來後才找到路人報警。
由於嫌疑人帶著面罩,又穿著厚厚的外套,受害人沒有看清他的長相,隻知道他說話帶點口音、身高 1.63 米(5.3 英尺)左右。
案件的偵查也一直沒有進展,就這樣過去 3 年。
就在上周二,事情迎來新轉機,加拿大警方找到一傢專門從事 DNA 分析服務的公司,對該案犯人留下的 DNA 進行表型分析,得到一張 3D 人像。
警方把它作為通緝令,發佈在其官網和Twitter等社交平臺上,並聲稱這是“在所有調查途徑都用盡後的最後手段”。
不過老實講,從通緝令上可以看出的信息並不多,能確定的似乎隻有他是一名年輕的黑人男性。
其他特征像嫌疑人的具體年齡、發型、是否有紋身、是否有疤痕都不得而知。
而且,讓加拿大警方沒想到的是,通緝令一經發佈,就在網上引起軒然大波。
許多隱私專傢表示,警方這一舉動是極其有害的,很有可能加劇種族偏見和侵犯 DNA 數據庫隱私。
美國電子隱私信息中心的全球隱私顧問 Callie Schroeder 就轉發該推文,並對 3D 人像的實用性提出質疑:
如果你看到這條消息,你會如何思考?難道懷疑看到的每個身高 1.63 米的黑人嗎?
他還進一步解釋:不解 DNA 表型知識的人看到合成圖像,很可能會相信嫌疑人長得和 3D 人像完全一樣。
他們意識不到這隻是一個近似值,年齡、體重、發型和臉型都可能相差很大,而且膚色、發色、眼睛顏色也可能有細微區別。
在 reddit 論壇上,熱評前幾也幾乎都是質疑聲。
我不明白這怎麼可能有用。
當警察缺乏必要的證據時,這將被操縱用來專門針對某人,或者隻是為騷擾他們不喜歡的人,這個主意太可怕。
有網友甚至還舉自己因為和通緝令上的頭像長得相似,被誤認為是嫌疑人的例子,力證這一行為的不靠譜:
最後,在巨大的輿論壓力下,加拿大警方不得不刪除這一通緝令,並表示會繼續尋找其他方法破案。
不過話說回來,用 DNA 還原 3D 人臉,真的沒有前途嗎?
DNA 還原 3D 人臉,什麼原理?
給警方提供 DNA 還原 3D 人臉照片的這傢公司名叫 Parabon NanoLabs。
公司成立於 2008 年,大約在 2015 年初推出一個名叫 Snapshot DNA 的 DNA 表型分析工具,可以基於 DNA 推測一個人的膚色、發色和種族等信息。
這項工具一發佈,就受到警方的熱烈歡迎,當年美國國防部還給 Snapshot DNA 專門提供 200 萬美元的研發資金。
2015 年 6 月,Snapshot DNA 成功協助美國警方偵破一起長達三年的謀殺案,如今罪犯已經在監獄服刑。
同時一些專傢也認為,Snapshot DNA 在一定程度上具有科學依據,包括人類的發色、瞳色、膚色以及身高都與基因有關。
BUT,這項技術發佈以來一直在遭到質疑 ——
畢竟 DNA 既不能解釋由於吸煙、飲酒、受傷(包括紋身)等引起的個人外貌變化,甚至連實際人臉大小都無法預測。
生物信息學 & Snapshot 部門技術主管、哈佛大學博士 Ellen Greytak 對此回應稱,盡管這項技術沒有將一個人的所有細節特征還原出來,但“提供一種針對罪犯長相的描述”。
Ellen Greytak 進一步介紹稱,Snapshot 是基於機器學習技術來根據 DNA 合成 3D 人像的,訓練數據來自公開 DNA 數據集和對應的人臉長相。
但對於 Snapshot DNA 背後的詳細算法原理,Parabon NanoLabs 拒絕公佈。
當然,目前學術界已經有不少針對類似算法的研究。
此前發表在 PNAS(美國國傢科學院院刊)上的一篇文章就試圖通過 1061 個來自不同種族和年齡段的志願者 DNA / 人像樣本,訓練出僅憑 DNA 還原膚色、身高、年齡等信息的 3D 模型。
雖然這個 AI 經過訓練後,臉型和膚色看起來比較接近:
但從實際數據來看,DNA 對於年齡等數據的預測準確度還有待提升:
所以,這些公開的 DNA 數據是怎麼來的?
主要來源於兩個傢譜分析網站 GEDmatch 和 FamilyTree DNA。
在這些免費公開的網站上,人們隻需要上傳自己的 DNA 信息,就能知道哪些名人 or 網友和自己有親屬關系。
甚至如果你上傳照片和出生年月等信息,各種傢譜網站還能幫你整理好一整個系的圖譜,但這些信息如今卻被用在訓練 AI 合成模型上。
如此來看,這項技術距離真正精確用上還有不少的路要走。
參考鏈接:
[1]https://www.pnas.org/doi/10.1073/pnas.1711125114
[2]https://www.edmontonpolice.ca/News/MediaReleases/DNAPhenotypeOct4
[3]https://www.edmontonpolice.ca/News/MediaReleases/StatementonDNAPhenotyping
[4]https://www.vice.com/en/article/pkgma8/police-are-using-dna-to-generate-3d-images-of-suspects-theyve-never-see