新版Midjourney AI繪畫再無Bug“有圖有真相”時代徹底過去


過去幾個月,以ChatGPT為首的聊天機器人攪得科技界滿城風雨,大傢都忙著去跟各傢的AI聊天,讓它們來寫郵件、寫代碼、寫詩。而當語言模型在大跨步向前進化時候,AIGC的另一個重要分支——繪圖,最近其實也完全沒閑著。

去年曾因拿下藝術比賽大獎而名噪一時的Midjourney,近期在AI生成圖片領域熱度可以說堪比OpenAI。MidjourneyV4版本去年年底幾乎跟ChatGPT同期上線,而就在上周GPT-4推出的時候,Midjourney也飛速推出第五代版本,而這一次的更新堪稱“炸裂”。

一周以來,各種用Midjourney生成的神圖層出不窮,國足奪冠、特朗普插秧、教皇打碟、異形下鄉……隻要你敢想AI就敢畫,而且隨便拿出一張都能做到以假亂真的程度。但可能有創作的偽照片過於真實,引起太多爭議,太多新用戶湧入導致服務器不堪重負,本周二,Midjourney宣佈關閉其免費賬戶的使用通道。

不過,另外一方面,在人們瘋狂娛樂的同時,一些人也嘗試著把ChatGPT和Midjourney結合起來使用,一些由人類構思、AI主導和操作的“人機合作”作品也逐漸顯現出商業化應用的輪廓。

|當圖片向照片進化:一個由AI創造的平行世界誕生

你有沒有想象過這樣的畫面:

在不久前落幕的卡塔爾世界杯上,整個綠茵球場變成一片紅色的海洋。大傢歡呼雀躍,全場掌聲雷動。


圖片來自小紅書博主,賬號:Ai船長

愛因斯坦沒有出現在實驗室裡,而是梳著標志性的發型,在音樂節上狂歡。



圖片來自Twitter

馬斯克沒有在21世紀造火箭和電動汽車,而是穿越到蘇聯工廠,真正當起一名“鋼鐵俠”(工人)。


圖片來自Twitter

這樣的世界,你覺得怎麼樣?

以上這些無比真實的照片,並不是由誰花大量時間PS制作的,而是很多普通人通過動一動手指頭,打幾個關鍵字,就讓人工智能在十幾秒內所自動生成的。

造就這以假亂真世界的幕後推手是一個名為Midjourney的AI生成圖片工具。可以說, 目前在AIGC繪圖領域,MidJourney是一個比OpenAI還神奇的存在。Midjourney沒有任何巨頭的重金支持,是一個自籌資金的獨立研究實驗室,它的發起人為曾兩次拒絕蘋果收購的Leap Motion公司的創始人David Holz,目前全職員工僅有11人。

但就是這麼一個超小型團隊,卻是當前AI繪圖領域最炙手可熱的明星,甚至將OpenAI的DALL-E、Stable Diffusion、英偉達的GauGAN2等同類工具都甩在身後。

|比肩GPT的更新速度,驚嘆和爭議相繼到來

Midjourney的迭代速度相較於OpenAI可以說是有過之而無不及。去年3月份第一版本首次上線,4月份便火速更新第二版本,接著7月份上線Open Beta V3版本首次向公眾開放,之後以其獨特的藝術性風格吸引一些用戶。其中,最出圈的就是這張由普通人給出提示詞、AI負責創作,跟人類藝術傢同臺比賽之後斬獲金獎的油畫。


之後Midjourney並沒有停下更新的腳步,11月又推出第四代版本添加更多圖片風格,緊接著今年3月份,Midjourney V5版本登場。此次V5版本的更新之所以能引發大量關註,主要是因為它解決一個技術難題和完成一次跨越性的突破。

其中,技術難題指的是——畫手。

讓AI畫出逼真的人類手部特征是一個看起來簡單但卻出奇復雜的任務。首先,在 AI的訓練圖集中,手往往都不是圖片的重點,同時人們握手、牽手、鼓掌等不同狀態下手部形態各異,很難形成標準化的模版,這也就造成AI學習難度的激增。

此外,即便對於傳統人類畫師來說,畫手也是最困難的地方之一。手的幾何形狀復雜,並沒有一套標準的線條或形狀,指關節上的皺紋和褶皺、手掌上的陰影等細節非常多,並且每個人的手都不一樣,是獨一無二的存在,並不能套用。

因此正確並精細化地畫手對於所有的AI工具來說都是一項困難的挑戰,在Midjourney的V5之前,行業內的AI繪畫工具都無法很好地完成。


Midjourney(左)、Stable Diffusion(右上)和DALL-E 2(右下)此前生成的奇怪人手,圖片來自buzzfeednews

但現在,Midjourney V5版本的已經完美解決這個問題。


圖片來自Twitter

不僅告別六指或畸形,還能結合人物特點畫出不同狀態和年齡畫出不同的手部細節,就連在光影中的手指紋路也能被完美呈現。


圖片來自於mpost

而除攻克畫手這個技術難題之外,Midjourney V5此次另一跨越性的突破在於——能夠生成照片級的圖片,並且還是攝影大師拍的那種。

在V5之前,Midjourney生成的圖片總體以卡通或超現實風格為主,但V5版本能夠支援包括真實、抽象、油畫等更廣泛的風格,圖像解像度比上個版本提高2 倍。而此次寫實風格的上線,可以說直接到讓很多攝影師都要感嘆“攝影學不存在”的地步。

比如,以“90年代大街上的模特”為主題,完美創造出真假難辨的照片。


圖片來自Twitter,賬號Nick St. Pierre

以“你好小朋友”為主題,用膠片質感完成童年重現。


圖片來自小紅書博主,賬號:逗比

以“發生颶風的新聞報道”為主題,無中生有地去還原一個災難現場等等。


圖片來自Twitter

從以上這些照片示例中可以看出,Midjourney的寫實圖片生成並不局限於一種固定的風格,而是會根據你描述場景和想要的風格來智能化的調整色調、像素、鏡頭語言等。最近Midjourney產出的很多圖片,甚至已經達到人的肉眼無法判別真偽的程度。

如果從技術的角度,Midjourney的進步無疑是讓人驚艷和贊嘆的。但可能也因為這些照片太過於真實和太多新用戶的湧入,本周二,Midjourney宣佈關閉其免費賬戶的使用通道。分析認為,此舉也是為防止更多離譜的“照片”出現,從而擾亂現實世界和散佈有害信息。

比如,此前真的就有媒體以把特朗普被捕的生成圖片當成真實現場照片,從而造成虛假新聞的出現和發酵。此外,Midjourney目前的關鍵詞審核機制並不嚴格,因此也存在產生大量有害照片的風險。Midjourney表示他們正在進一步加強對於AI生成內容的監管和審核。


圖片來自於The Verge

| ChatGPT+Midjourney強強聯合,AI作品走向商業化應用

目前,MidJourney仍然需要結合Discord使用,使用方法依然很簡單,通過輸入文字和一些參數要求描述即可。目前還支持用戶上傳自己的圖片,再根據圖片進行AI生成。

目前,一段完整Midjourney的“咒語”示例大概如下:

A man in futuristic armor with cyberpunk details(對想要呈現圖片的文字描述,可以添加更多細節),shot on Canon R6 with 50mm f1.2(風格描述,可以提出是什麼設備拍攝的、或者是以哪位知名藝術傢或攝影師的風格),--v 5(使用第五代版本技術)--ar 4:6 (畫幅比例,V5 版本中你可以自定義任何比例)--iw 1(輸入的參考圖片的權重占比)

雖然咒語的構成並不算復雜,但對於很多隻有一個模糊想法的普通用戶來說,如何讓Midjourney來畫出自己腦中圖像仍然比較困難。於是,ChatGPT也登場。


ChatGPT能發揮什麼作用呢?首先你可以模糊地描述你的構想,讓ChatGPT拓展成一個充滿細節的畫面描述,接著讓它從這段文字描述中提取關鍵詞。然後,你可以將Midjourney的提示句的語法構成告訴ChatGPT,再通過幾次訓練讓Midjounery記住如何通過你輸入的關鍵詞來創建Midjourney的命令語法。

之後你隻需要復制粘貼ChatGPT給你的指令粘貼到Midjourney的命令框裡即可生成圖片,如果你不滿意還可以讓ChatGPT來繼續幫你修改完善關鍵詞。

目前,已經有很多人已經在嘗試將ChatGPT和Midjourney結合產出的結果,應用於自己的工作中。比如,做電商的不再需要去花大價錢去找攝影師、設計師,而是隻需要把產品圖片和關鍵詞提供給AI工具,就能直接生成商業大片。


圖片來自小紅書博主,賬號:阿湯嬌嬌啊、阿泰ATAI動態視覺

未來甚至也不用找真人模特,直接用AI生成就行。


還有人將其用於室內傢居設計領域,幫助自己來做網站、生成宣傳圖片等。


可以預見的是,ChatGPT和Midjourney的合作可能僅僅隻是AI商業化應用的一個開端。隨著AI技術的快速發展,各種工具的出現讓AI的應用范圍也會指數級的擴大。目前,在設計、電商、廣告、遊戲、影視等各個領域都湧現出更多的用例,在娛樂性大大增強的同時,全新的機遇賽道也在被開啟。

最後,讓我們來做一個無獎競猜。以下兩張烤雞的圖片中,你認為到底哪一張才是由真的相機拍攝的呢?




相關推薦

2023-04-01

出來的呀?嗯哼,當然都來自我們大名鼎鼎的AI記者——Midjourney。今天愚人節,量子位就在此獻上一期特別節目:盤點Midjourney制造的那些大為震撼的假 新 聞。(註:圖1來自Twitter博主Soviet Visuals,圖3來自小紅書AI繪畫博主@九月

2023-03-31

字生成圖片的討論熱情空前高漲。緊接著,3月18日,美國Midjourney公司宣佈第五版AI圖像生成服務,即MidjourneyV5。本來就處在行業領先水平的Midjourney,這一次版本更新真正讓AI繪畫圈沸騰。因為MidjourneyV5生成的圖片堪稱兩個系統幾

2023-08-25

快科技8月24日消息,NVIDIA今天發佈Q2財報,這是該公司史上最炸裂的一季,營收135.07億美元,同比增長101%,凈利潤61.88億美元,同比上升843.3%,毛利率首次超過70%,都是歷史最好水平。毫無疑問,NVIDIA的業績主要是靠AI驅動的,

2023-08-25

快科技8月24日消息,NVIDIA今天發佈Q2財報,這是該公司史上最炸裂的一季,營收135.07億美元,同比增長101%,凈利潤61.88億美元,同比上升843.3%,毛利率首次超過70%,都是歷史最好水平。毫無疑問,NVIDIA的業績主要是靠AI驅動的,

2023-08-25

快科技8月24日消息,NVIDIA今天發佈Q2財報,這是該公司史上最炸裂的一季,營收135.07億美元,同比增長101%,凈利潤61.88億美元,同比上升843.3%,毛利率首次超過70%,都是歷史最好水平。毫無疑問,NVIDIA的業績主要是靠AI驅動的,

2023-04-15

作上,這類產品目前還無法很好的實現。然而AI繪畫工具Midjourney和Stable Diffusion這樣的工具,卻會讓遊戲行業最重要的組成部分之一遊戲美術,迎來一輪大洗牌。如今在微博、知乎、脈脈等社交平臺上,就有不少因為Midjourney、Stab

2023-05-16

5月15日晚間,MidjourneyAI在微信發佈《Midjourney官方中文版·內測申請》的通知,邀請中國創作者加入Midjourney官方中文版內測。Midjourney官方表示,Midjourney中文版搭載在QQ頻道上。據知情人士對記者透露,本次MJ中文內測屬於MJ自主入

2022-09-22

僅僅隻用一分鐘而已。你所需要做的,就是打開一個名為Midjourney的AI生成藝術工具,再打上一段你想要呈現的文字,系統就將自動返回四幅極富創造力和藝術感的作品供你選擇,而以上這張圖片隻是其中之一。今年以來,各種文

2023-04-05

AI 代勞呢?AI 會做的比人類更好嗎?最近,AI 繪畫神器 Midjourney 就上新一個功能:/describe。“今天,我們發佈一個 /describe 命令,可讓您將圖像轉換為文字。”具體來說,Midjourney 學會從圖像中反推 prompt。如果你在 Midjourney 上傳

2024-05-10

究所研究員、麻省理工學院講師Lior在X(原Twitter)上,“有圖有真相”地證明OpenAI已經在SSL證書日志中創建“search.chatgpt.com隨後在 5 月 8 日,彭博社援引知情人士爆出更多的產品細節。根據報道,不同於 ChatGPT 聊天機器人的回答

2023-04-06

業,而且年薪開到 25-33 萬美元(約合人民幣 170 萬 +)。有圖有真相要做的事,就是調教 ChatGPT。因為這種 AI 的輸出結果質量和輸入有關:你的輸入越詳盡、專業,AI 生成內容就越好;否則 AI 可能會寫出一段空泛的廢話。

2022-09-05

術比賽拿大獎?沒錯,這是真事。一位小哥用AI繪畫工具Midjourney生成的作品,在美國科羅拉多州博覽會的藝術比賽中獲得第一名。結果一宣佈,人類畫傢們就炸鍋。一名藝術傢在Twitter上的“犀利”吐槽已經獲得8萬+點贊,1萬+轉

2022-09-01

遊公司Incarnate Games總裁Jason Allen提交,其使用AI繪畫工具Midjourney生成這一獲獎作品。這張照片描繪一個既古典又夢幻的場景,看起來像是來自太空歌劇,一些古典人物站在巴洛克式大廳中,陽光透過巨大的圓形的“觀景窗口”,

2023-07-08

快科技7月7日消息,在世界人工智能大會WAIC2023上,MidJourney創始人大衛霍爾茨發表他對人工智能發展的看法。他表示,自己非常喜歡閱讀兩類書,一個是科幻文學,另一個是中國古典文學,MidJourney名字的來源就是莊子,莊周夢蝶