給張圖就能反推Prompt AI繪畫神器Midjourney能夠“看圖說話”

2023-04-05 來自機器之心發表於業界精選

在各種AIGC產品層出不窮的今天，讓AI畫一張圖已經不是什麼難事。盡管有著“無需動筆”、“零門檻作畫”等一系列優點，但很多人並不能借助AI之手輕松獲得一幅理想中的作品——難點在於“prompt”。

Prompt 方法是一門極深的管理學問：如果不輸入精準的命令描述，生成結果就可能十分隨機，甚至與預期相去甚遠。但歸根結底，如何給出完美的 prompt，如何讓模型按照人類用戶預設的方式輸出結果，甚至如何降低花在 prompt 上的成本，很少有人清楚。

正因此，AIGC 產業衍生出一種專門的職業 ——prompt 工程師。前段時間，初創公司 Anthropic 在舊金山招聘“prompt 工程師和圖書館員”，給出的薪水高達 33.5 萬美元。

或許，這一過程也能讓 AI 代勞呢？AI 會做的比人類更好嗎？

最近，AI 繪畫神器 Midjourney 就上新一個功能：/describe。

“今天，我們發佈一個 /describe 命令，可讓您將圖像轉換為文字。”

具體來說，Midjourney 學會從圖像中反推 prompt。如果你在 Midjourney 上傳一張圖片，它會提供給四個版本的描述，你可以直接拿來並進行調整，然後去生成自己想要的圖片變體。

Midjourney 是一款 2022 年 3 月發佈的 AI 繪畫工具，此前剛剛推出第五代版本，由於生成效果十分“炸裂，大量用戶迅速湧入，以至於該公司不得不關閉免費註冊通道。

這一次功能的更新意義重大：

改進可訪問性：通過用於 Web 顯示的 ALT 文本元素，圖像描述讓有視覺障礙或閱讀困難的人更容易訪問數字內容；

增強的可搜索性：描述可以通過搜索引擎啟用更好的搜索功能和索引；

用於標題：可以包含描述，使圖像更加清晰；

詳細 prompt：描述可用於創建更詳細的 prompt 以制作新變體，可以為快速工程提供靈感。

怎麼使用？

用戶隻需從寫一個「 /describe”開始，Midjourney 提供上傳圖像的位置：

上傳圖片後，點擊進入：

然後，Midjourney 根據圖像返回四個描述：

底部的四個數字是混合按鈕，每個數字都與相應的描述相匹配。單擊數字，Midjourney 會根據新的描述重新混合圖像。

你也可以混合修改 prompt：

這是創建示例圖像的原始 prompt：

an illustration of a brain with tree roots, psychedelic art, vibrant, by Alex Grey, by Amanda Sage, by Robert Venosa, neon colors（一幅有樹根的大腦圖像，迷幻藝術，充滿活力，作者 Alex Grey，作者 Amanda Sage，作者 Robert Venosa，霓虹顏色）

這是 Midjourney 描述的 prompt 之一，被用於混合：

An image of an abstract brain tree with roots, in the style of mark henson, luminous colors, dark symbolism, detailed anatomy, bold lines, vibrant color, psychological phenomena illustrations, chiaroscuro woodcuts（一幅有樹根的抽象大腦樹圖像，馬克・亨森的風格，明亮的色彩，黑暗的象征主義，詳細的解剖學，大膽的線條，鮮艷的色彩，心理現象的插圖，千鳥格的木刻）

新的生成結果如下：

試用體驗

該功能一經發佈，就吸引各位 AI 繪畫愛好者的註意，很多人立馬就上手開始創作。

以下是通過一張 NASA 登月任務宇航員照片生成的新圖片（右），的確以假亂真：

下圖（左）為原圖，（右）為 /describe 之後生成的新結果：

還有人想到，可以用 /describe 來進行品牌 logo 的升級。如此一來，既可以延續此前的品牌辨識度，又帶來全新的形象。

星巴克的“新 logo”毫無違和感。

蘋果公司的經典標志，也可以是五彩繽紛的：

這是阿迪達斯：

百事公司可以考慮以下這款新設計：

不管是“文生圖”還是“圖生文”，隨著用戶交互的增加，MidJourney 的效果必然會有所提升。有研究者猜測，MidJourney 一直在進行大規模的人類反饋強化學習（RLHF），而這可能是有史以來規模最大的文字轉圖像。擁有的用戶越多，MidJourney 能做的 RLHF 就越好，然後獲得的用戶會變得更多。

給張圖就能反推Prompt AI繪畫神器Midjourney能夠“看圖說話”

相關推薦

AI繪畫，為何聽不懂人話？

AI真的快讓我失業

用QQ召喚繪畫機器人？AI繪畫工具Midjourney牽手騰訊

普通人用上癮藝術傢看流淚：這個爆火的AI真能一鍵挑戰大師畫作？

“那年馬斯克在蘇聯”

教你用ChatGPT賺錢的人賺的就是你的錢

新版Midjourney AI繪畫再無Bug“有圖有真相”時代徹底過去

AI沖擊下誰會失業？第一波遊戲美術或已轉完崗

0門檻“AI繪畫”驚爆畫師圈 AI畫作的版權該歸誰？

盡管AIGC爭議不斷但我們都知道世界真的被改變

盡管AIGC爭議不斷但我們都知道世界真的被改變

盡管AIGC爭議不斷但我們都知道世界真的被改變

🤖📚 強烈推薦的AI小說推文神器

我一個插畫師給AI打下手，月入3千