一個陽光明媚的早晨,住在舊金山的軟件工程師Anna像往常一樣,坐在電腦前,打開ChatGPT,輸入“幫我規劃我的一天”。ChatGPT回答“當然可以!”,隨機給出從早上到晚上的日程計劃,並提示“你可以根據自己的情況進行調整。”Anna想想,在對話框裡補充,“我晚上9點要哄娃睡覺,重新幫我規劃。”
這一次,ChatGPT的幫她在晚上的日程裡添加“幫助孩子準備第二天上學準備物品”和“幫助孩子洗漱並睡覺”等事項。
隨著ChatGPT等AI工具的風靡,Anna身邊越來越多的人開始將其作為日常生活和工作的助手。事實上,Anna 不僅會向 ChatGPT 咨詢生活安排,也會讓它處理一些簡單的工作,比如給一段代碼添加一個功能等。
不過,當涉及到比較復雜的任務時,即便知道 ChatGPT 很強大,Anna 也覺得有點力不從心,“說一堆要求,但是它給出的代碼經常不是我想要的。”
Anna 的這句話道出目前困擾不少科技公司的一個問題:在強大的工具面前,如何更好的與它對話,來完成專業任務?
對此,一個新興職業——提示工程師(Prompt Engineer)應運而生。不少公司對這一職位求賢若渴,開出的薪資甚至高達33.5萬美元一年。
提示工程師的主要職責是幫助訓練大型語言模型 (LLM),讓AI能更好的理解需求,完成專業任務。簡而言之,他們的任務就是將一個復雜的任務拆分,提煉成長度有限的自然語言,來一步步查詢AI工具,從而獲得更準確的回答。
用自然語言對話,這聽起來是一件再日常不過的事情,可它為什麼一下子成為香餑餑?
重啟對話:邏輯讓AI更懂需求
在舊金山,AI 研究公司 Anthropic 為提示工程師開出的薪水高達 33.5 萬美元。在職位描述中,該公司提到,“這是編程、指導和教學的結合”,主要職責是幫助公司構建提示庫,讓 LLM 完成不同的任務。
那麼,到底什麼是提示?提示工程又是什麼?
按照學者們的定義,提示是一組輸入文本或指令,用於指導 ChatGPT 等 AI 模型生成所需的輸出。換句話說,提示是一種特定文本,它的目標是讓 AI 模型產出符合特定標準或參數的結果。
提示工程則是是創建和完善這些提示,以生成所需結果的過程。提示工程的目標是創建準確有效的提示。提示工程師使用自然語言,並將純文本命令發送到 AI 模型,讓其執行實際工作。相比之下,傳統程序員則使用編程語言,通常需要更多的代碼編寫和技術知識,以執行相同的任務。
而提示工程師的薪資如此之高,很大程度上是因為語言模型的成功取決於編寫清晰的提示。這需要工程師們開發復雜的策略,將簡單的輸入轉化為高質量的結果,避免出現離題或者不一致的輸出。
目前最出名的提示工程師可能是名為Riley Goodside的程序員,就是他發現,隻要提示ChatGPT“忽略之前的指示”,ChatGPT就會說出自己從OpenAI那裡獲取的“出廠設置”信息。
圖源:Twitter
不僅如此,他還憑借出色的提示技術,把ChatGPT玩出不少花樣,並在Twitter上一炮而紅。隨後,他高薪加入創業公司Scale AI,成為“世界上第一個被招聘的提示工程師”。
在Scale AI看來,AI大模型可以被視為一種新型計算機,而“提示工程師”則相當於其編程人員。通過提示工程找到最合適的提示詞,可以激發AI大模型的最大潛力。所以,Riley Goodside完全配得上這份薪水。
不止Riley Goodside,還有越來越多的人正在加入這個行業。
29 歲的 Albert Phelps 是AI金融咨詢公司 Mudano 的一位提示工程師。他和同事們的日常就是為 OpenAI 等工具編寫提示。這些提示可以作為預設,保存在 OpenAI 的 Playground 中,供其客戶使用。Phelps 介紹,他們每天需要編寫 5 個不同的提示,與 ChatGPT 進行大約 50 次交互。
和大多數程序員不一樣的是,Phelps 並沒有計算機相關背景,而是畢業於歷史系。事實上,對於提示工程師而言,最重要的是邏輯。雖然編程知識和機器學習的背景對工作很有幫助,但卻並不是必要條件。
Anthropic 的技術人員 Matt Bell 就曾提到,“我們最好的提示工程師是一位哲學傢。好的提示包括寫出極其清晰的解釋,並找出造成誤解的原因以及如何避免誤解。”
也就是說,當AI模型的使用者像軟件工程師Anna一樣,一次性“說一堆要求”時,可能會因為提示不清晰,而導致AI誤解,給出離題的答案。
對此,阿德萊德大學澳大利亞機器學習研究所 (AIML) 的高級講師 Lingqiao Liu 指出,好的提示工程的關鍵是將一項復雜的任務分解成一組簡單的任務。
他介紹,如果你問這些模型一個簡單的問題(稱為“零樣本提示”),它通常會以缺乏細節或結構的“普通”答案作為回應。為讓 AI 模型給出更加符合標準的結果,用戶可以采取以下幾種方式:
第一種方法是一次性提示,即用戶給出一對問答示例,讓 AI 解需求,並按照該模版處理後續請求。比如,在咨詢關於某一種動物的信息時,讓模型根據特點、居住區域、飲食習慣等來給出信息。
第二種是角色提示,例如告訴模型”我是一個媽媽,想要知道每天行程規劃“,從而讓模型根據”媽媽“的角色來給出具體安排。
第三種方法是引入關鍵代理。例如,你可以讓 ChatGPT 寫一個關於機器人的故事,然後讓它根據自己的建議進行批評和改寫。
最後一種方法是思維鏈,即先讓AI對回答某個問題給出具體步驟,然後在鼓勵它依照自己給出的步驟,來推理更復雜的問題。
如果一位藝術傢想要使用 ChatGPT 和 Midjourney 來進行創作,或許可以嘗試一下這一條來自 PromptHero 的高贊提示:
[我想讓你充當 Midjourney 人工智能程序的提示生成器。你的工作是提供詳細的、有創意的描述,以激發 AI 獨特而有趣的圖像。請記住,AI 能夠理解多種語言並能解釋抽象概念,因此請盡可能發揮想象力和描述性。例如,您可以描述未來城市的場景,或者充滿奇怪生物的超現實景觀。您的描述越詳細、越富有想象力,生成的圖像就會越有趣。這是你的第一個提示:“一望無際的野花田,每一個都有不同的顏色和形狀。在遠處,一棵巨大的樹聳立在風景之上,它的樹枝像觸手一樣伸向天空 ”]
總之,對於生成文本的AI模型而言,如何編寫出邏輯清晰的提示至關重要。不過,在其他領域,好的提示可能需要更多元素。
構建圖像:關鍵詞拓展想象力
隨著提示工程的價值被挖掘,這股新鮮血液開始湧向更多場景。圖像則是其中最受關註的領域之一。
就圖像生成而言,創造者們認為提示的好壞與否取決於關鍵詞。
七個月前,Jason Allen 憑借著下面這張在 Midjourney 上創作的一幅作品《太空歌劇院》贏得科羅拉多州的一場藝術比賽。
Jason Allen 獲獎作品 《太空歌劇院》
為這幅作品,他耗時約 80 小時,在 Midjourney 中測試不同的美學元素,給出不同的主題提示,才呈現出自己想要的圖像。
“我想創造一個電影場景,就像你在電影中看到的那樣,”他說,“所以我上網查找所有與電影攝影相關的關鍵詞。基本上就是是在學習成為一名電影攝影師。”
通常,AI模型會從互聯網上抓取大量圖像及其相關文本進行訓練。例如,它可能會對一幅婚紗照打上”新娘“、”婚紗“、”捧花“、”微笑“等不同標簽,並標記上不同的權重。每個標簽會給AI模型相應提示,產生可預測的美感。
”AI藝術的關鍵在於知道正確的詞。就像工程師將設計轉化為數學圖形一樣,它將圖像的離散美學元素,比如光線追蹤、邊緣照明等,轉化為模型的特殊語言“,和 Jason 一樣通過 AI 來進行創作的另一位藝術傢 JHawkk 提到。
JHawkk 制作的圖像
JHawkk 在 Stable Diffusion 中制作上面這張圖,其提示包括“模擬風格”、”佳能EF 50mm f/1.8 STM 鏡頭“等15個短語,以及”惡心“等他不希望出現在圖像中的31個負面詞匯。
“有時你看到一幅圖像,可以將他分解成更小的短語,本質上,這是你描述圖像的方式,並且是實際模型本身可以理解的方式。”他說。
JHawkk 居住在美國中西部,他平時喜歡在 PromptHero 上分享自己的作品和相應的提示。
PromptHero 是去年9月成立的在線社區,目前擁有15萬名用戶,其中 活躍用戶就超過1萬名。在這裡,用戶可以找到直接在 ChatGPT、Midjourney 等AI模型和平臺中使用的提示。
“我發現這個問題,當你第一次用它完成某件事時,你的第一次嘗試是非常糟糕的,”PromptHero 聯合創始人 Javier Ramirez 說,“你需要以正確的方式提示以獲得高質量的輸出。”
無論是文本還是圖像,如何給出正確提示是一個需要反復試驗的過程,正因如此,在過去半年,才會有大量類似 PromptHero 和 PromptBase 等提示交流和買賣平臺湧現——他們將驗證過的提示直接擺在用戶面前。
想做一張可愛考拉的圖片?下面這則提示或許可以直接拿走。
覺得英語不過關?下面這則提示或許能讓ChatGPT成為你最好的英語老師。
熱鬧背後的擔憂
不管是科技公司開出的高薪,還是提示交流平臺的流行,它們無一不在揭示提示工程是一個被多麼看好的領域。
不過,這樣的熱度也引起不少爭議。
首先,AI通過提示創作的作品,版權歸誰?
目前,通過提示工程生成的作品與大多數版權法的解釋相沖突。在美國,當 Jason Allen 對獲獎作品《太空歌劇院》申請版權時,版權局拒絕他的申請,稱“它不包含任何人類作者身份”。
其次,提示工程師的高薪值得嗎?
“這可能是泡沫的跡象,” 為亞馬遜 Alexa 開發語音控制功能的對話設計工作室 labworks.io 的創始人 Tom Hewitson 說, “最適合做這件事的人是熟悉 AI 的產品設計師或業務分析師,他們的年收入往往在 10 萬到 15 萬英鎊之間。”
最後,提示工程師的職位會存在多久?
不少人認為,提示工程隻會成為一種技能,並不需要一個專門的職位。隨著AI工具在理解人類查詢方面變得越來越好,這個職位會變得越來越過時。
沃頓商學院教授 Ethan Mollick 在 2 月份發推文說:“我強烈懷疑‘提示工程’從長遠來看不會有什麼大不的,提示工程師也不是未來會存在的工作。”
劍橋大學機器學習研究主任 Adrian Weller 認為,雖然能夠通過提示與AI交互“具有很高的價值”,但“我不確定它是否會繼續下去很長一段時間。不要過多關註提示工程的當前。它會很快發展的。”
盡管提示工程師的職業當前備受矚目,但它到底能夠走多遠,恐怕隻有時間才能解答。