如果說2021年是“元宇宙”的元年,那麼2022年或許就是“AI作畫”的元年。稍微對互聯網熱點有所關註的人都不難發現,最近,“AI作畫”產出的作品似乎已經成一股互聯網風潮。這些看起來完成度頗高、畫風又有幾分名傢韻味的畫作往往能給人留下深刻印象,而當人們得知這些畫作完全由AI繪制,不存在任何“門檻”,更是又多一份驚異與好奇心。
在此之前,我們想要收獲一張符合自己審美需求的圖片,要不就在茫茫大海般的同人網站中進行撒網篩選,要不就得花點小錢找中小畫師定制一張。如今,我們可以在平臺上輸入各種與風格、主題、氛圍有關的關鍵詞,然後AI就會根據算法生成符合要求的畫作,藝術似乎在突然之間成為一件觸手可及的事情。
AI名畫,《空間歌劇院(Théâtre D'opéra Spatial)》
當然,上文所說的“門檻”之所以打上引號也是有原因的。因為“AI作畫”的出現,雖然在一定程度上降低用戶在美術造詣上的門檻,但是卻在其他方面為用戶增加新的門檻,不論是花大價錢去用別人已經訓練好的AI模型作畫,還是利用顯卡的本地算力來進行AI作畫,都不是一件簡單的事情。
果不其然,顯卡廠商們早早洞察到這個趨勢。近日,外媒VideoCardz 消息,英偉達已經在最新的522.25驅動中取消RTX 30系列顯卡的算力限制,似乎是想用算力全開帶來的AI創作體驗挽回客戶。唯一的問題是,在礦潮褪去、遊戲旺季未至之時,“AI作畫”真的能夠成為刺激顯卡需求的關鍵嗎?
突然爆火的AI作畫
事實上,“AI作畫”是一個存在接近半個世紀的概念。根據WikiPedia介紹,早在上世紀70年代,英國畫傢哈羅德·科恩便已經開始AI作畫的嘗試,當時他用自己研發的電腦程序“AARON”去控制一個機械臂進行繪畫創作,而這個算法也隻能產生色彩艷麗的抽象派風格畫作。
(圖源:WikiPedia,哈羅德和他的畫作)
在隨後的五十年時間裡,AI作畫其實一直都是這個趨勢——即可以生成色彩艷麗的抽象派風格畫作,但卻不能生成寫實或者具象的繪畫作品。直到2021年初,OpenAI發佈廣受關註的DALL-E系統,AI才開始獲得按照文字輸入提示來進行創作的能力,而AI作畫的發展更是進入突飛猛進的階段。
在隨後的一年時間裡,隨著Disco Diffusion、DALL-E 2、Imagen、Midjourney和Stable Diffusion等作畫工具先後出現,AI作畫的風格開始變得越來越多變,生成的圖片不再局限於抽象,而是能夠產出具體的人物/事件,畫出的作品也越來越符合邏輯。
然而,要說“AI作畫”這個概念真正火起來,那還得是2022年的下半年。因為在這段時間裡,出現兩個專攻二次元作畫的網站,其中一個是8月底上線的AI作畫網站mimic,該網站主攻日系二次元畫風頭像,要求用戶上傳15至100張圖像讓AI進行學習,然後輸出相同畫風的AI畫作。
所謂mimic,就是模仿者、擬態物的意思,這個命名非常好地展現出該網站的核心賣點及爭議要點。模仿原作者畫風生成的AI畫作,雖然很接近用戶喜好的作畫風格,但明顯會給原作者帶來困擾,隨後畫師們掀起的一系列“拒絕畫作被mimic使用”的浪潮,更是讓這個網站的經營者做出緊急下線的決定。
(圖源:mimic)
盡管mimic涼,但是利用二次元AI作畫來盈利的網站顯然不會隻有這麼一個。10月上旬,一傢名為NovelAI的網站悄然上線AI作畫功能,該網站采用開元的Stable Diffusion作為基礎,搭配上采集自P站熱門作品的NovelAI Diffusion模型,可以讓用戶輕松創作出完成度頗高的二次元畫作。
和過往的AI作畫不同,NovelAI的入門方式簡單(註冊會員)、創作方式多樣(文本生成、原畫改寫、簡筆畫生成)、出圖素質較高(有充分訓練的多個模型打底),最重要的是,符合二次元愛好者的取向,這也使得“AI作畫”這個概念在本月迅速爆火。至於NovelAI非法爬蟲P站稿件訓練模型,或是網友利用草稿生成畫作反訴作者這些爭議事件,則都是後話。
與日俱增的顯卡需求
那麼有人就會問,既然這些“AI作畫”都是跑在服務器上的,那又怎麼會對顯卡市場的供需關系帶來影響呢?
答案非常簡單,那是因為目前市面上存在著兩種AI繪畫的方法。其一是在線法,用戶隻要花錢就能在NovelAI上面無限生成畫作,這樣的優點是沒有顯卡算力的限制;其二是本地法,通過在本地加載AI算法和模型來生成畫作,這種做法的優點是生成作品沒有限制,而且不用花錢,但是所有運算過程都得靠自己的電腦來跑。
(圖源:知乎)
為測試本地AI作畫對性能的要求,小雷昨晚特地用一晚上時間完成本地版NovelAI的部署。經過實測,在加載泄露壓縮版模型(4GB)的情況下,移動版RTX 3060顯卡最多隻能生成360*512尺寸的圖片,而且生成一張圖片的時間長達5-10分鐘,體驗非常拖沓。
值得關註的是,本地版NovelAI已經是目前占用資源最少的一種架設方式,StableDiffusionWebUI的占用更高,而且這加載的還是壓縮版模型,因為內存限制的緣故,移動版RTX 3060顯卡無法成功加載目前泄露出來的完整版模型(7GB),在作畫質量上會有些許差距。
(圖源:twitter,采用IMG2IMG算法做出來的圖,理論顯卡運存不低於16GB)
總的來看,擁有6G運存的獨立顯卡算是目前運行本地版AI作畫的一個基礎配置,而且越新的顯卡體驗就越好。目前RTX計算卡是運行效果最理想的顯卡,其次則是30系顯卡,20系、10系及以下老顯卡的支持都不太好,至於AMD顯卡則是完全沒有進行過優化。
對於可以妥協的用戶來說,個人建議通過采用低分辨率生成畫作,然後Upscale至高分辨率的方式來生成畫作。這種做法可以有效降低顯卡占用,讓隻有基礎配置的用戶也能借此進行畫風/人物學習,但是這樣生成的圖片在整體畫面細節上肯定會有所缺失。
至於追求畫作質量的用戶,那自然就要更換顯卡。正好,9月23日,英偉達在GTC大會上發佈新品顯卡RTX40系列,其中RTX 4090采用臺積電“4N”制程工藝和高達24GB GDDR6X顯存,相比上一代RTX3090Ti性能提升可達2~4倍,可謂是完美的AI作畫工具。
不得不說,這波浪潮的到來,和RTX 40系顯卡的發佈時間可謂完美契合,再加上老黃近日及時解鎖的RTX 30系算力限制,難怪NGA論壇的用戶都在討論:“怎麼感覺礦潮之後,AI作畫要成為新的顯卡需求啊?難道這波作畫模型泄露的受益者,真的是剛剛發佈新顯卡的老黃?”
對於這個觀點,個人覺得應該分開來看。對創作者而言,在虛擬貨幣的風波過去後,顯卡在AI算力方面的提升才真正被釋放出來。AI作圖工具在二次元的產業應用上肯定是非常強的一個存在,畫師可以用其輔助作畫、輕小說傢可以用其繪制人設,至於獨立的遊戲制作人更是可以大幅降低成本。
但是對普通人而言,AI作圖工具本質上隻是風靡一時的新玩具罷。盡管不用親手繪制,但是想從AI繪制出來的大量作品中找出高質量作品也是一件非常需要耐心的活。在這一波熱潮過後,大部分人還是會回到收集畫師作品的軌道上,想要借此拉動大量顯卡需求確實有些不太現實。
在顯卡需求下滑的當下,強如英偉達也需盡快尋找顯卡之外的新業務,為下一階段業績增長提供更多想象空間。有趣的是,從NVIDIA Canvas的推出來看,英偉達確實有考慮過發展“AI作畫”這方面的業務。AI作畫或許不能成為刺激顯卡業務增長的動力,但是其能否成為英偉達未來所倚重的優勢業務,還有待進一步觀察。