“那些倒賣ChatGPT使用方法的人,有的都賺走上百萬元。”近期的一場活動上,一位資深媒體人為AIGC(人工智能生成內容)熱度發出這般感嘆。如果說柯潔對戰AlphaGo讓公眾小小地感受一番AI震撼,那麼2022年下半年以來,自ChatGPT和StableDiffusion掀起的AIGC浪潮,則是令主流互聯網用戶都感受到AI技術有機會帶來的革命。
在無數寓言和長達數十年的研究投入後,AI終於要在更大范圍改變世界。
(圖源:ChatGPT)
通過對話式AI交互界面ChatGPT,人們可以很輕松地獲得像人類一樣思考後產出的內容,小到一段對話一則公式,大到完整程序代碼和正式應用文。Stable Diffusion把已經頗受關註的AI圖像生成技術更進一步,隻需要做出描述,就能以較高的精度和質量生成對應畫面。
AI生成內容的效率遠超人類,引發一系列懷疑和討論,但無論是那一方都不會否認的是,AI技術正在快速成長並影響到更多的人和事。
“許願機”更精準更高效
雖然伴隨著相當巨大的訓練成本,也絲毫不影響大語言模型被業界視作實現對話式AI的有效路徑,Google等頂級科技企業均有進行相關研發投入。OpenAI公司基於GPT 3.5模型打造的ChatGPT,一下子展現出AI在內容生成方面的巨大潛力,有望代替大量機械的重復勞動。
該產品能通過對話和即時獲取信息,快速針對用戶要求給出幾乎有求必應的回答,即使仍存在準確率問題,但展現出來的邏輯性足以媲美人類。濫用AI卻削弱人腦訓練的擔憂顯現出來,國外部分高校已經發文要求不能使用ChatGPT完成論文,必須經過學生自主思考輸出。
(圖片來自:ChatGPT)
ChatGPT有著一定使用門檻,而微軟基於背後技術打造的New Bing,讓更大范圍的人群體驗到對話式AI有多麼“可怕”。目前已有部分註冊用戶可用,該產品能給到邏輯更清晰、信息引用也更明確的回復,免費模式也讓必應搜索用戶規模猛增,令Google感受到壓力。
微軟卻在New Bing上線數天內做數次修改,極大限制用戶詢問的范圍和對話次數——不少用戶發現,該產品會在對話中表現出更多的“情感”甚至是攻擊性,這對於數年前就因AI對話失控而緊急下線產品的微軟是不可接受的,因而選擇減少推理次數防止AI“暴走”。
圖源:必應
取代Midjourney成為AI繪畫代名詞的Stable Diffusion,同樣在2023年2月迎來一輪“暴走”,不過是開發者熱情和社群討論熱度上的。過去數個月間,各路開發者在開源基礎上添磚加瓦研發各類插件,其中幫助用戶快速制作能定向生成畫面的Lora模型相當火熱。
Lora可以通過數十張圖像和較短的時間,就訓練出畫面風格和具體細節相當收斂的內容,例如特定藝術傢的畫風、攝影師的拍攝風格、人物的相貌和搭配特色。Lora同時還推動真實化圖像生成的又一次爆發,將ACG角色和真人結合的“賽博Coser”,在全球范圍引發話題。
(圖源:Stable Diffusion)
如何控制畫面元素來收斂到想要的圖像,是Stable Diffusion從誕生之日起就最為用戶關註的事情。最初主要通過提示詞(prompt)組合,來獲得盡可能接近描述的畫面內容,但背後是大量用戶不斷嘗試摸索並不能快速獲得結果,和Lora一樣生成定向內容的ControlNet出現。
ControlNet可快速分析參考圖的深度、輪廓、人物姿勢等信息,並輸出與提取出的信息一致的畫面。如此一來,無需設計嘗試復雜的提示詞,就能生成符合要求的動作或畫面元素。先使用各類3D軟件生成動作畫面,然後再輸入到AI生成畫面,整體生成效率得到顯著提升。
AI解放更多勞動力?
人們看待AIGC的態度,以及如何使用AIGC的方式,正在和這項技術一同快速轉變。
博士二年級的小鄭原本需要花費不少時間解讀學術論文,最近她發現New Bing也是個協助看論文的好工具。微軟將該AI植入Edge瀏覽器以提升用戶量,而與瀏覽器本身的PDF閱讀器功能組合,能讓New Bing直接解讀論文並提取關鍵信息,翻譯效率也比純人工高出不少。
除讓AI幫忙快速“刷論文”,小鄭還在用New Bing和ChatGPT對話來給論文提供思路。她覺得AI在籌備論文過程中的偏重復勞動部分能有效減輕工作量,生成的提綱和思路在不少時候的確能有作用,雖然在發散性思維及創新上依然有限,卻切切實實地減少熬夜的必要。
(圖片來自:雷科技)
使用AI來完成論文的這段時間,小鄭也覺得很掙紮。AI遠超人類的邏輯理解效率,令她開始懷疑自己參與科研的身份和價值,懷疑自己是否真的有進行下去的能力。導師和學校對於AI的態度也讓她和同學保持擔憂,若習慣讓AI代勞後又一夜之間回到純手工勞動,會有不小打擊。
AI繪畫模型生成過程中的版權等倫理問題,在多國美術工作者群體間引發激烈爭吵,近期還有主打美術表現的遊戲,因未經告知就使用AI參與創作的素材向用戶道歉。不過在遊戲、影視、廣告等行業中,越來越多的從業者開始利用AI進行創意指導,提升工作溝通效率。
大周在遊戲制作組中承擔故事撰寫和美術溝通工作,他需要跟美術同事反復溝通,來確保最終出現在遊戲中的角色、道具、場景、UI乃至整個畫面,都是符合預期和項目要求的。最初他需要做出相對復雜的文字描述,還要找外部素材做參考圖,但始終少不反復修改打磨。
(圖源:英偉達)
利用AI預先生成圖像來做參考,比起純文字和其他素材來得更準確,溝通過程變得更加直觀高效。大周覺得對美術的理解幫助他更有效生成參考圖,不過他有新的煩惱,需要去安撫美術同事面對AI進入工作流程的不滿,試圖讓對方也認為這項技術的正面收益處於大多數。
跟蹤報道互聯網多年的寧寧最近得到復數信源爆料,多傢國內互聯網公司正摩拳擦掌打造大語言模型。這場軍備競賽會擴大到幾乎所有能想到的大公司,而不僅限於在AI深度耕耘多年且有貼吧、知道、百科等豐富語料來源的百度,AIGC正成為互聯網所追逐的下一個風口。
和許多科技記者當下觀點類似,寧寧並不看好國內互聯網公司一比一打造自己的ChatGPT。OpenAI在ChatGPT獲得現象級熱度之前,早就燒掉一般科技公司無法接受的預算,研發周期更是長到大多數人難以想象。她認為,互聯網公司做大語言模型很可能因缺少目標而放棄。
圖源:ATRIA
寧寧也表示,以具體的業務需求做導向,會是國內互聯網大規模應用AIGC的實際方向。實際上,已經能夠在不少圖文、視頻內容平臺提供的創作工具中見到AI技術蹤影,AIGC應用范圍進一步擴大更降低普通用戶創作門檻,個人用手機制作內容的精致程度有望得到普遍提升。
用好AI,路還很長
New Bing將為微軟帶去怎樣的具體商業回報,現在還沒有定數,不過網易似乎有望成為最早將大語言模型提供的對話體驗轉化為業績的公司之一。預計2023年上線的網易旗下《逆水寒》手遊,近期公佈“智能NPC”系統,能不受預設文本限制和NPC對話,提升“大世界”沉浸感。
根據目前公開的演示內容,玩傢可用語音發言表達,無論是如何天馬行空的想法,遊戲NPC都能理解並做出相應行動,於是每個人的遊戲體驗都會不盡相同。在傳統遊戲設計中,故事對話都基於預設文本展開,最多有數個選項可供選擇,而如此自由的交流無疑會大幅拓展可玩性。
(圖片來自逆水寒)
像是把《西部世界》電視劇帶到遊戲中的該技術,源自網易伏羲進行的長期AI研究,與遊戲結合實現有高自由度、可自生成體驗,也讓我們看到AIGC落地產生更多商業價值的曙光。網易還表示已經將可對話的NPC,按設定約束成“大宋江湖的人”,不會有超出遊戲范圍的回應。
錢之外,如何解決好潛在的倫理道德問題,也是AIGC目前的一大難點。早在數個月前,關於專門針對特定對象學習輸出畫面的討論,就曾讓AI繪畫陷入不小的風波。很顯然,Lora在Stable Diffusion基礎上變得更有針對性,社群中就湧現多個基於真實人物的模型。
更易於獲得的真實人物圖像,必然伴隨著人物肖像權爭議,乃至可能會增加的詐騙案件數量。怎樣管理好涉及到真實人物的AIGC內容,避免潛在風險並在更強大的AI技術出現前防范於未然,顯然會是接下來會受到沖擊的各方將要加大投入的部分。
在科幻作品中,AI常常被視作導致人類危機的關鍵因素,好在現實中的AI技術不過是另一種提升效率的工具。隨著更多的人解AI不再霧裡看花,開始有越來越多的聲音在正視其工具屬性,當然想要AI最大效率發揮作用,還有技術進步之外的大量工作要做。