近期,一個名為DragGAN的AI圖片編輯工具備受矚目。它實現簡單的點擊鼠標、拖動關鍵點,就能達到與Photoshop相似的效果。相對於Photoshop等工具,它更加容易上手,不需要專業的技能,也不需要精確地控制單個對象的位置、形狀、表達或排列。
簡單來說,DragGAN讓用戶在圖像上指定一個點,就能改變圖片的結構和整個像素。它與其他流行的生成AI圖像工具(如Dall-E和Midjourney)有很大的不同,後者隻能通過文本提示生成特定的圖片,無法精確輸出所需的姿勢或佈局。
據解,DragGAN是由MIT、谷歌、馬普所(MaxPlanckInstitute)等機構聯合開發的新模型,該項目的相關論文已入選SIGGRAPH2023,研究人員展示一種控制GAN進行圖像處理的新方法。
隻要處理的圖片與GAN訓練數據集的類別相匹配,DragGAN就可以處理逼真的圖像。這些類別包括動物、汽車、人、細胞和景觀。
論文還展示一個簡單的界面,用戶可以在圖像中指定點並將其拖動到所需的位置來實現圖片編輯。例如,讓貓咪閉上眼睛,讓獅子轉頭並張開它的嘴巴,或將汽車轉換為另一種模型。而且,DragGAN還提供遮罩功能,用戶可以突出顯示想要更改的圖像的特定部分,而其餘部分不受影響。
DragGAN怎麼用?
具體操作步驟如下:
案例1:讓小狗豎起耳朵
如果你想讓小狗豎起耳朵,你隻需要在小狗身上設置幾個點,玩法和PS中的圖釘工具類似。定住幾個不需要動的地方,然後將耳朵上的兩個點往上拉,就可以改變小狗耳朵的動向。