千年一瞬,他們眨眼的瞬間,仿佛歷史重演。前不久,外國博主PanagiotisConstantinou用AI修復秦代兵馬俑。
更令人驚艷的是,他還讓古人做出細微的動態表情。
快看,兵馬俑在向你眨眼、微笑。
去過兵馬俑後,大傢都會對這些泥塑真人古跡的感到震撼。再看用AI復原後的兵馬俑,竟變成有血有肉的大叔。
每個兵馬俑的表情都是千奇百態,幾千年過去,我們很難想象出他們當時的樣子。
這位外國小哥讓這些兵俑重新煥發生機,穿越千年來和你對話。
此前,B站UP主大谷也對兵馬俑進行修復,讓其嘴巴也動起來。
其實,除兵馬俑,Panagiotis Constantinou還對埃及帝王敵後、古希臘哲學傢、英國女王等做一系列動態修復。
接下來一起欣賞下。
穿越時空相逢
古羅馬末期聲名顯赫的首富Marcus Crassus
亞歷山大大帝
古埃及艷後
英國女王
......
憑借這一系列修復,外國博主也爆火出圈,也引來許多人的關註。
修復技術
那麼AI修復工作一般都是如何實現的呢?
大多都會用到這三個技術:第一個是負責做補幀的DAIN,第二個是做分辨率擴增的ESRGAN,第三個是上色的DeOldify。
DAIN:深度感知視頻幀插值(DAIN)模型,通過探索深度信息來顯式地檢測遮擋。該項目開發一個深度感知流動投影層,優選取樣更近的物體,以合成中間流插補視頻幀。
ESRGAN:ESRGAN改進自SRGAN ,主要用來做視頻超分辨率。
與SRGAN的深層模型越來越難以訓練相反,更深層次的 ESRGAN 模型通過簡單的訓練就能達到卓越的性能,核心點在於平衡視覺質量和峰值信噪比的網絡插值策略。
DeOldify:DeOldify 使用NoGAN 進行訓練,NoGAN對於獲得穩定和豐富多彩的圖像是至關重要的。
NoGAN 訓練結合 GAN (美妙的著色)的好處,同時消除副作用(如視頻中的閃爍對象)。
不論是圖像還是視頻,AI能夠將其修復得栩栩如生,最主要的是歸功於它強大的學習能力。
這裡我們再簡單解一下AI修復離不開的「靈魂GAN」。
還記得馬和斑馬相互轉換的圖像嗎?這便是GAN的應用之一。
和其他經典的機器學習算法相比,GAN算法最大的創新點便是它結合生成器(Generator)和判別器(Discriminator),以二者的相互對抗進而實現相互優化,最後達到一個「勢均力敵」的狀態。
以圖像為例,判別器D經過反復訓練,最後希望可以準確分辨出哪一個是真實的數據分佈,哪一個是生成器的數據分佈;同時,生成器G也不斷地訓練,最後希望能夠以假亂真,讓判別器判斷不出到底哪個是真的圖像,哪個是假的圖像。
現在越來越多的技術像是AI修復、AI換臉等都離不開GAN網絡,曾經困擾GAN的難題,比如難以收斂等也都漸漸得到改善,而且基於GAN也衍生出越來越多的更優秀的網絡,比如CycleGAN、StackGAN等,愈加逼真、生動的圖像逐一呈現在大眾眼前。
現在大抵是「萬物皆可AI」的時代!
AI還會繼續給我們帶來何種視覺驚喜,我們拭目以待~~~