給張圖就能反推Prompt AI繪畫神器Midjourney能夠“看圖說話”


在各種AIGC產品層出不窮的今天,讓AI畫一張圖已經不是什麼難事。盡管有著“無需動筆”、“零門檻作畫”等一系列優點,但很多人並不能借助AI之手輕松獲得一幅理想中的作品——難點在於“prompt”。

Prompt 方法是一門極深的管理學問:如果不輸入精準的命令描述,生成結果就可能十分隨機,甚至與預期相去甚遠。但歸根結底,如何給出完美的 prompt,如何讓模型按照人類用戶預設的方式輸出結果,甚至如何降低花在 prompt 上的成本,很少有人清楚。

正因此,AIGC 產業衍生出一種專門的職業 ——prompt 工程師。前段時間,初創公司 Anthropic 在舊金山招聘“prompt 工程師和圖書館員”,給出的薪水高達 33.5 萬美元。

或許,這一過程也能讓 AI 代勞呢?AI 會做的比人類更好嗎?

最近,AI 繪畫神器 Midjourney 就上新一個功能:/describe。


“今天,我們發佈一個 /describe 命令,可讓您將圖像轉換為文字。”

具體來說,Midjourney 學會從圖像中反推 prompt。如果你在 Midjourney 上傳一張圖片,它會提供給四個版本的描述,你可以直接拿來並進行調整,然後去生成自己想要的圖片變體。

Midjourney 是一款 2022 年 3 月發佈的 AI 繪畫工具,此前剛剛推出第五代版本,由於生成效果十分“炸裂,大量用戶迅速湧入,以至於該公司不得不關閉免費註冊通道。

這一次功能的更新意義重大:

改進可訪問性:通過用於 Web 顯示的 ALT 文本元素,圖像描述讓有視覺障礙或閱讀困難的人更容易訪問數字內容;

增強的可搜索性:描述可以通過搜索引擎啟用更好的搜索功能和索引;

用於標題:可以包含描述,使圖像更加清晰;

詳細 prompt:描述可用於創建更詳細的 prompt 以制作新變體,可以為快速工程提供靈感。

怎麼使用?

用戶隻需從寫一個「 /describe”開始,Midjourney 提供上傳圖像的位置:


上傳圖片後,點擊進入:


然後,Midjourney 根據圖像返回四個描述:


底部的四個數字是混合按鈕,每個數字都與相應的描述相匹配。單擊數字,Midjourney 會根據新的描述重新混合圖像。

你也可以混合修改 prompt:


這是創建示例圖像的原始 prompt:

an illustration of a brain with tree roots, psychedelic art, vibrant, by Alex Grey, by Amanda Sage, by Robert Venosa, neon colors(一幅有樹根的大腦圖像,迷幻藝術,充滿活力,作者 Alex Grey,作者 Amanda Sage,作者 Robert Venosa,霓虹顏色)

這是 Midjourney 描述的 prompt 之一,被用於混合:

An image of an abstract brain tree with roots, in the style of mark henson, luminous colors, dark symbolism, detailed anatomy, bold lines, vibrant color, psychological phenomena illustrations, chiaroscuro woodcuts(一幅有樹根的抽象大腦樹圖像,馬克・亨森的風格,明亮的色彩,黑暗的象征主義,詳細的解剖學,大膽的線條,鮮艷的色彩,心理現象的插圖,千鳥格的木刻)

新的生成結果如下:


試用體驗

該功能一經發佈,就吸引各位 AI 繪畫愛好者的註意,很多人立馬就上手開始創作。

以下是通過一張 NASA 登月任務宇航員照片生成的新圖片(右),的確以假亂真:


下圖(左)為原圖,(右)為 /describe 之後生成的新結果:


還有人想到,可以用 /describe 來進行品牌 logo 的升級。如此一來,既可以延續此前的品牌辨識度,又帶來全新的形象。


星巴克的“新 logo”毫無違和感。

蘋果公司的經典標志,也可以是五彩繽紛的:


這是阿迪達斯:


百事公司可以考慮以下這款新設計:



不管是“文生圖”還是“圖生文”,隨著用戶交互的增加,MidJourney 的效果必然會有所提升。有研究者猜測,MidJourney 一直在進行大規模的人類反饋強化學習(RLHF),而這可能是有史以來規模最大的文字轉圖像。擁有的用戶越多,MidJourney 能做的 RLHF 就越好,然後獲得的用戶會變得更多。


相關推薦

2023-03-31

字生成圖片的討論熱情空前高漲。緊接著,3月18日,美國Midjourney公司宣佈第五版AI圖像生成服務,即MidjourneyV5。本來就處在行業領先水平的Midjourney,這一次版本更新真正讓AI繪畫圈沸騰。因為MidjourneyV5生成的圖片堪稱兩個系統幾

2023-04-02

新聞“炸彈”震得心驚。以ChatGPT為代表的AI語言模型,以Midjourney為代表的AI繪畫產品,讓世界見識AI的效率及能力。它們的應用速度遠比想象中快,近一個月,ChatGPT開放API(應用編程接口),升級出的GPT-4,微軟已經應用到搜索

2023-05-16

5月15日晚間,MidjourneyAI在微信發佈《Midjourney官方中文版·內測申請》的通知,邀請中國創作者加入Midjourney官方中文版內測。Midjourney官方表示,Midjourney中文版搭載在QQ頻道上。據知情人士對記者透露,本次MJ中文內測屬於MJ自主入

2022-09-22

僅僅隻用一分鐘而已。你所需要做的,就是打開一個名為Midjourney的AI生成藝術工具,再打上一段你想要呈現的文字,系統就將自動返回四幅極富創造力和藝術感的作品供你選擇,而以上這張圖片隻是其中之一。今年以來,各種文

2023-04-01

出來的呀?嗯哼,當然都來自我們大名鼎鼎的AI記者——Midjourney。今天愚人節,量子位就在此獻上一期特別節目:盤點Midjourney制造的那些大為震撼的假 新 聞。(註:圖1來自Twitter博主Soviet Visuals,圖3來自小紅書AI繪畫博主@九月

2023-04-18

獲得更大的商業化價值。現階段,AI繪畫課主要學習的是Midjourney和Stable Diffusion兩款軟件,內容包括輸入關鍵詞的技巧,控制AI隨機性,以及在IP手辦、UI、室內設計、遊戲圖標等應用場景的實戰演練等。這類課程的第一波學習人

2023-03-31

也完全沒閑著。去年曾因拿下藝術比賽大獎而名噪一時的Midjourney,近期在AI生成圖片領域熱度可以說堪比OpenAI。MidjourneyV4版本去年年底幾乎跟ChatGPT同期上線,而就在上周GPT-4推出的時候,Midjourney也飛速推出第五代版本,而這一

2023-04-15

作上,這類產品目前還無法很好的實現。然而AI繪畫工具Midjourney和Stable Diffusion這樣的工具,卻會讓遊戲行業最重要的組成部分之一遊戲美術,迎來一輪大洗牌。如今在微博、知乎、脈脈等社交平臺上,就有不少因為Midjourney、Stab

2022-10-15

越來越快。今年以來,在國外,谷歌Imagen、Disco Diffusion、MidJourney、DALL-E 2等一大波AI繪畫平臺、工具陸續上線、更新,它們帶來的AI繪畫效果越來越強大。在國內,今年8月,百度發佈“AI繪畫”首款產品“文心·一格”,支持古風

2023-02-27

因而選擇減少推理次數防止AI“暴走”。圖源:必應取代Midjourney成為AI繪畫代名詞的Stable Diffusion,同樣在2023年2月迎來一輪“暴走”,不過是開發者熱情和社群討論熱度上的。過去數個月間,各路開發者在開源基礎上添磚加瓦研

2023-02-27

因而選擇減少推理次數防止AI“暴走”。圖源:必應取代Midjourney成為AI繪畫代名詞的Stable Diffusion,同樣在2023年2月迎來一輪“暴走”,不過是開發者熱情和社群討論熱度上的。過去數個月間,各路開發者在開源基礎上添磚加瓦研

2023-02-27

因而選擇減少推理次數防止AI“暴走”。圖源:必應取代Midjourney成為AI繪畫代名詞的Stable Diffusion,同樣在2023年2月迎來一輪“暴走”,不過是開發者熱情和社群討論熱度上的。過去數個月間,各路開發者在開源基礎上添磚加瓦研

2024-05-27

s是一個AI寫作工具,隻需輸入角色、地點和背景信息,它就能幫你生成內容,提供故事管理功能。從此告別創作障礙,靈感無限!✨2. Wavemaker 💻Wavemaker是一款小說創作軟件,能輕松構建小說結構,包括章節、場景,還能做筆記

2022-10-09

工具的生成效果究竟如何?首先針對作畫工具本身,包括Midjourney、以及各種基於Stable Diffusion生成的工具如Lexica和KREA等等,目前都已經開放關鍵詞搜索和提示詞生成的用法,可以免費使用。以Lexica為例,先來看看用關鍵詞生成的