草圖人像變3D模特:360° 無死角還原姿勢 一張就行


一張隨便勾畫的草圖,居然也可以分分鐘自動變成逼真的3D模型?!360°無死角不說,轉換期間真的不需要任何其它角度姿勢的輸入。這就是獲得SIGGRAPH2022榮譽獎的一個最新3D姿態估計模型:Sketch2Pose。



除草圖,像這樣的小猴子,四肢嚴重不按比例生長,Sketch2Pose也可以辦到:

‍‍


‍‍

‍這是如何做到的?

隻要4步,草圖人變3D人

將草圖上的人物/形象變成3D模型,此前的研究中都還未專門涉及。

該任務 最大的挑戰就是比例失真問題,因為畫上的東西可能頭大身子小、胳膊長腿短……

為此,Sketch2Pose通過 對三個關鍵元素進行預測來消除繪制姿勢時的可能出現的“歧義”。

這三個元素分別是:

  • 2D骨骼切線 (2D bone tangents)

  • 自接觸區域 (self-contacts)

  • 骨骼縮短比例 (bone foreshortening)

其中,2D骨骼切線 (下圖藍色部分)是預測3D骨骼方向最有力的指標 (關節位置不行)。

自接觸區域 (如下圖綠色部分,手接觸腰的位置)對於理解3D姿勢至關重要,也是消除未知身體部位歧義的線索。

骨骼縮短轉換系統則利用統計分析來糾正原圖中的比例問題。


根據這三者預測,再使用最先進的優化框架 (optimization framework),並用專門設計的一種新的損失 (loss)來平衡姿勢自然度,以及與輸入草圖的相似性,AI就能最終推斷出符合畫者意向的3D姿勢。

具體步驟如下:

輸入一張草圖,首先預測出2D關節位置或骨架,用於3D人體模型的粗略對齊。

然後預測屏幕空間 (screen-space)接觸區域,將其映射到粗略對齊的3D模型上,得到一組接觸頂點 (紅色部分)。

接著,利用縮短轉換階段描述的草圖人物比例問題,進行修補。

最後,在優化框架中利用2D骨架的骨骼切線、粗略對齊的3D姿勢以及比例修補,產生最終結果。


有遮擋缺失也OK

最終的Sketch2Pose可以 支持多種草圖風格的轉換,比如下圖中的簡筆畫或者水墨畫,像下下圖最後一張那樣簡略的也可以。


同時, 對缺失、遮擋部位也能穩健處理。

比如上圖第一行中的人手 (不過我們發現左邊的似乎推測有錯,手應該是放在兩腿之間;右邊的抱頭基本沒啥問題,但手掌應該向後彎曲) 。

再將Sketch2Pose和SOTA方法進行比較,結果還是令人非常滿意的。

可以看到,Sketch2Pose (第三列)對姿勢還原的更到位,缺失部分的預測也更符合人體構造。


而開頭那隻小猴子,Müller et al. 2021等方法的轉換效果就是下面這樣:

對於猴子“扭曲”的下肢部分,這些方法都出現理解偏差——Sketch2Pose完勝。

作者介紹

Sketch2Pose一共有兩位作者,都來自 加拿大蒙特利爾大學

一作名叫Kirill Brodt (Кирилл Бродт) ,出生於1991年,本碩畢業於新西伯利亞州立大學 (數學學位),後在Yandex數據分析和計算機科學中心學院學習機器學習,現為蒙特利爾大學的一位博士生。

他的主要研究方向為跟草圖有關的計算機視覺轉換。

另一位作者名叫Mikhail Bessmeltsev,是一作的導師,蒙特利爾大學計算機科學與運籌學系的助理教授。


感興趣的同學可以戳論文原文,或者去Huggingface上試試效果。

項目主頁:

https://www-labs.iro.umontreal.ca/~bmpix/sketch2pose/

Huggingface demo:

https://huggingface.co/spaces/SIGGRAPH2022/sketch2pose

Github代碼:

https://github.com/kbrodt/sketch2pose


相關推薦

2022-10-17

公司,對該案犯人留下的 DNA 進行表型分析,得到一張 3D 人像。警方把它作為通緝令,發佈在其官網和Twitter等社交平臺上,並聲稱這是“在所有調查途徑都用盡後的最後手段”。不過老實講,從通緝令上可以看出的信息並不多

2024-07-19

大片級表現輕松捕捉,讓每幅畫面都充滿震撼與美感。在人像拍攝時,它追求真實自然的質感,確保人像細節豐富,色彩還原準確,讓人像光彩奪目。搭配景深攝像頭,能實現人景自然分割,使成像畫面中的主體與背景層次分明

2022-11-17

包容性。Google表示,它推出一個新的照片庫,其中有148名模特,代表"不同的膚色、年齡、性別、臉型、種族和代表性不足的皮膚類型"。這傢科技巨頭聲稱,這可以為購物者提供超過2000種粉底色澤,從而提高他們找到合

2022-09-05

盤中間。這樣機械臂就能 360 度的移動旋轉,做到理發無死角。肯定有差友要舉手提問,上面這都不重要,重點是機器不長眼啊。萬一白刀子進去,紅刀子出來咋整?老哥一開始的時候,思路開闊,上去就準備整一個攝像頭動態

2023-03-24

GPT4火之後,AI就成網絡熱詞,還有人因此面臨失業,淘寶模特似乎就是其中之一。對於AI模特的出現,很多網店店主表示歡迎,因為它不僅省錢,還能提高效率。不過,目前的AI模特,不完善的地方也有不少。在另一邊,AI模特的

2023-04-16

0後”茹茹愛上“90年代通勤穿搭”。在一場復古走秀裡,模特穿著基礎款服裝——緊身打底衫、包裙、休閑襯衣、配上珍珠項鏈,沒有繁復的修飾,但她舉手投足間就展現出慵懶又精致的氣質。茹茹花將近1000元買一件馬甲和一

2023-01-31

行。同時,Atlas的模型預測控制器(MPC)會調整其發力、姿勢、動作發生時機等細節,來應對環境、腳滑等各種可能實時出現的因素。並且,MPC還允許Atlas跨行為邊界預測下一步的行動,比如它知道這次跳躍後是一個後空翻後,

2024-05-24

O Reno12 Pro的核心賣點之一,Reno12系列標配「5000萬AI全焦段人像三攝」,為用戶提供卓越的拍攝體驗。其廣角鏡頭搭載的IMX890傳感器,憑借大底的硬件優勢和OPPO對傳感器的調校經驗,為用戶帶來出色的影像體驗。人像鏡頭則采用

2022-09-15

性還是挺高的。比如用自帶壁紙,就是高光部分會保留;人像則是主體保留更多,背景暗掉;甚至像官方的彩虹壁紙,隻是底色變黑,彩虹的亮度減少很小;令人意外的是,這個AOD甚至可以自適應亮度,隨著環境光的改變調節亮

2024-05-25

與實地操作幾乎無異的體驗。通過六塊工業拼接屏的360無死角顯示,操作人員能夠實時掌握車端各個場景的動態,特別是在夜間工作時,主視野的視距達到驚人的50米,側視野的視場角也更為寬廣,確保對鏟刀工作狀態的全面掌

2024-04-01

覺。對圖像壓縮來說,相較於其他圖像,人會更容易發覺人像在壓縮前後的差異,所以也就更容易比較不同算法的好壞。正是由於以上種種優點,Lenna很快成圖像處理的標準測試圖片。根據國外一個網站統計,91年後Lenna在互聯網

2023-03-23

(截圖工具)”還是Windows 10上的“Snip & Sketch(截圖和草圖)”,都存在類似漏洞。這意味著,當你截圖後裁切掉敏感的人名、地址、賬號等信息後,掌握漏洞訣竅的黑客可以將被裁掉的內容還原。另外,谷歌Pixel手機的圖片

2022-08-02

,又是AI在搞“魔法”。在看《老友記》之後,AI能直接還原出宛如真實現場的3D場景,補足兩個切換畫面之間人物在不同角度時的姿態。沒拍過的角度畫面,它都能重建出來。還能把一個近景鏡頭,變成大遠景。乍一眼看去,真

2023-11-08

稱發現Microsoft365套件中的117個漏洞,而這些漏洞均存在於草圖大師SketchUp中。該公司表示,他們在對Office3D組件進行逆向工程之後發現,微軟調用多個SketchUpCAPI來讓應用處理SketchUp(SKP)文件。就是在這一過程中,該公司發現20多