目前,ChatGPT還沒有通過圖靈測試的評估。其實,迄今為止,還沒有人工智能模型能真正通過圖靈測試。去年11月,美國人工智能研究公司OpenAI發佈一款名為ChatGPT的聊天機器人,其在推出後的幾周內就風靡全球,甚至引發一場新的全球人工智能競賽。
社交媒體推特首席執行官埃隆·馬斯克在使用ChatGPT後直呼其“好得嚇人”,甚至斷言“人工智能越發強大,離對人類產生威脅不遠”。
《自動化與工作的未來》一書作者、美國雪城大學教授亞倫·貝納納夫說,200年前,人們對自動化技術產生一波又一波的恐懼,人們看到新技術,就害怕它們會完全取代人類的勞動。
今年2月初,ChatGPT開啟“狂飆”模式,引起新一輪瘋狂的技術升級、產業重構、資本狂潮、巨頭逐鹿。起初,隨著這波技術熱浪席卷全球而心情起伏不定的普羅大眾,經過一段“沉浸式”體驗,雖未感到恐懼,但仍不免有些擔憂。
實現對話式AI的第一步
ChatGPT僅發佈2個月,月活躍用戶就超過1個億。
要知道,“1個億”可不是個小目標,達到這一數字,Facebook 用4.5年,WhatsApp用3.5年,Instagram用2.5年,谷歌則用將近一年。
中國科學院自動化研究所研究員、數字內容技術與服務研究中心主任張樹武在接受科技日報記者采訪時表示,人們可以把ChatGPT視為繼語音、圖像視頻識別技術之後最復雜的語言識別技術突破,也是基於模式識別和深度學習的感知智能技術發展的新躍遷。
天津大學自然語言處理實驗室負責人、教授熊德意表示,從人工智能發展角度看,這是一個重要的裡程碑,其意義要高於7年前的“阿爾法狗”。
他告訴記者,圍棋界的“阿爾法狗”刷新普通大眾對人工智能技術的看法,但是其本身並不能廣泛應用,普通大眾也難以與其直接接觸。
ChatGPT則完全不同。
與“阿爾法狗”相比,ChatGPT可以直接應用或支撐很多場景應用和產品。如果說“阿爾法狗”是技術應用的“陽春白雪”,那麼ChatGPT或許有機會成為“下裡巴人”。
的確,在用戶們不懈努力地發掘ChatGPT的用途後,人們發現,它不僅僅是個聊天工具,還可以寫代碼、寫情書、寫論文,也可以在線問診,編寫情景腳本、詩歌、小說,甚至是擬定旅遊路線、回答腦筋急轉彎,可謂“有求必應”,功能強大到無法想象。
ChatGPT在快速滲透各個行業,普通大眾都可以成為ChatGPT的用戶,這是其火爆出圈的重要原因。
事實上,此前已有許多跟機器人聊天的相關應用,我們最熟悉的莫過於常用的智能語音助手。ChatGPT與之有何不同呢?
“智能音箱采用的同樣是自然語言處理技術、對話式AI技術,但是語言智能比較初級。很多情況下,我們隻能與它們進行一問一答式的簡單對話。”熊德意說,“而ChatGPT,其底層技術不僅與一般的智能音箱底層技術截然不同,而且要比它們強大得多,不僅如此,它改進與它同類的技術InstructGPT的人類反饋數據收集形式,在與人對話中,可以基於歷史內容,支持連續多輪對話。”
熊德意認為,ChatGPT是實現對話式AI的第一步。
從互聯網層面來看,它可以作為信息入口,與搜索引擎相結合;還可與辦公軟件結合,增強辦公效率;從人機交互角度看,它體現的是一種基於自然語言的交互方式,可以與元宇宙、數字人結合。此外,它還可以充當機器人大腦。
“如果從人類信息發展的尺度上看,它在人與機器之間的信息接口方面有很大突破。”熊德意如是說。
“十八般武藝”樣樣精通
ChatGPT使用GPT-3技術,即第三代生成式預訓練Transformer(Generative Pretrained Transformer 3)。這是一種自回歸語言模型,使用深度學習來生成類似人類的文本。
據英國廣播公司《科學焦點》雜志介紹,GPT-3的技術看似簡單,例如它接受用戶的請求、聽取問題或提示並快速回答,但其實這項技術實現起來要復雜得多。該模型使用來自互聯網的文本數據庫進行訓練,包括從書籍、網絡文本、維基百科、文章和互聯網其他文本中獲得的高達570GB的數據。更準確地說,它在5000億個單詞組成的訓練數據上進行高強度訓練。
GPT-3.5是GPT-3微調優化後的版本,比後者更強大。ChatGPT正是由GPT-3.5架構的大型語言模型(LLM)所支持的。
ChatGPT也可以被描述為一個自然語言處理(NLP)領域的人工智能模型。這意味著它是一個能夠編碼、建模和生成人類語言的程序。
作為一種語言模型,在大規模文本數據上進行自監督預訓練後,ChatGPT還需要經過三個階段的“煉制”。首先是監督微調階段,在該階段,人類AI訓練師既充當用戶,同時也是AI助理,以自我對話形式生成對話樣例,ChatGPT在這些對話樣例上進行有監督的訓練。
接著,ChatGPT進入第二個階段。該階段的主要目的是訓練一個基於語言模型的獎勵模型,對機器生成的回復進行評分,為訓練該獎勵模型,需要隨機抽取機器生成的文本,並采樣出多個不同版本,人類訓練師對這些不同版本進行偏好排序,排序的結果用於獎勵模型的訓練。
基於訓練好的獎勵模型,第三個階段采用強化學習技術進一步微調ChatGPT。
這項技術與眾不同之處在於,它能夠基於以上介紹的人類反饋強化學習技術,使生成的文本能夠與人類意圖和價值觀等進行匹配。
無論懂不懂技術,全球網友都競相大開“腦洞”,試探ChatGPT到底有多“神”。據美國有線電視新聞網報道稱,有人要求它用《坎特伯雷故事集》的風格重寫上世紀90年代熱門歌曲《Baby Got Back》;有人寫一封信,要求ChatGPT刪除信用報告中的不良賬戶;還有人詢問它以童話為靈感的傢裝設計方案。
自然語言處理技術撥雲見日
一炮而紅後,ChatGPT概念股也跟著一路“狂飆”。有媒體報道,漢王科技9天收獲7個漲停板。自然語言處理研究是該公司主營業務,而ChatGPT背後的技術就是NLP。
熊德意告訴記者,NLP是人工智能的一個分支,最早誕生於機器翻譯,其歷史實際上比“人工智能”名字的歷史還要悠久,至今已研究70多年。簡單來說,該技術的目標就是要讓計算機或機器人能夠實現像人一樣具備聽、說、讀、寫、譯等方面的語言能力。
“ChatGPT並非一項技術的一蹴而就,它是多種技術疊加在一起形成質變的產物,是NLP領域的結晶。”熊德意解釋,其底層技術,包括Transformer、自監督學習、微調、人類反饋強化學習(RLHF)、AI對齊等,在自然語言處理和人工智能領域都有廣泛的研究和應用。
“但ChatGPT將這些技術巧妙地結合在一起。它有效規避大模型的未對齊行為,利用大模型規模帶來的智能突現能力,增強大模型的指令學習能力和用戶意圖捕獲能力,解鎖大模型的泛化能力。這些能力疊加在一起形成ChatGPT的質變效果。”熊德意說。
美國《邁阿密先驅報》報道稱,推特上的一位用戶在ChatGPT的幫助下參加一次模擬SAT考試,得到1020分(滿分1600分)。根據College Simply的數據,這隻略低於平均水平。
但當我們提問ChatGPT“你能幫我通過考試嗎”,它會善意地提醒我們不要利用它來作弊,並表示:“重要的是要記住,測試的目的是評估你對材料的理解和掌握程度。作弊,或者僅僅依靠像我這樣的外部來源,會破壞考試的價值,也不會促進學習或成長。”
這是因為ChatGPT被加入預先設計的“道德”準則,也就是上文提到的人類反饋強化學習。
OpenAI表示:“這使該工具能夠回答後續問題、承認錯誤、挑戰不正確的前提並拒絕不適當的請求。”
熊德意認為,這是因為RLHF有效提升大模型的對齊能力,即如何讓AI模型的產出和人類的常識、認知、需求、價值觀保持一致。
經過RLHF的“調教”,ChatGPT變得高度擬人化,可以學習並生成聽起來十分自然的回復。RLHF還使ChatGPT能夠理解指令並做出適當的響應,從而使對話更加真實。
ChatGPT也因此迅速成為當下所有智能聊天機器人中的“天花板”。
雖觸手可及但無法取代人類
隨著科技的發展,人工智能技術一次又一次地超越人們認為無法達到的極限,從1997年IBM“深藍”計算機首次在國際象棋中擊敗人類,到IBM人工智能機器人“沃森”贏智力競賽《危險邊緣》(Jeopardy),再從2016年“阿爾法狗”在圍棋大戰中戰勝人類,到2019年號稱“AI賭神”的Pluribus在德州撲克中碾壓人類玩傢……
現在,ChatGPT已經觸手可及,拉扯沖撞著人們慣有的參與生產生活的模式和框架,且繼續“狂飆”在超越人類的賽道上。“ChatGPT引發十大職業危機”“未來20種職業或被AI取代”等話題頻上熱搜。
它真的會跟人類搶飯碗,甚至取代人類嗎?
《邁阿密先驅報》報道稱,根據SortList對6個不同國傢的500名ChatGPT用戶進行的一項調查,“打工人”已經在考慮其對自己所在行業意味著什麼。研究稱,大約23%在軟件和技術領域工作的員工擔心會因它失去工作,超過40%的雇主則表示有興趣“聘用”營銷文案花樣多多的ChatGPT。
美國哥倫比亞廣播公司財富觀察欄目刊文稱,其他專業領域也可能會因此改變工作流程,包括中級寫作、廣告、媒體策劃和法律文件。
“ChatGPT和其他人工智能技術有可能改變工作的性質,但它們不會取代對人類的需求。”當把“是否會代替人類工作”的問題拋給ChatGPT時,它說,它們旨在協助和增強人工任務,而不是取代人類。它們作為人力資源的補充,並提高人類解決問題的能力,提升效率和效果。
熊德意認為,目前來看,人工智能更多的作用是提高人的效率,輔助人類。與此同時,大眾需要與時俱進,熟悉並掌控新技術,就像學習使用計算機、手機一樣,畢竟這些新技術一定會產生新的就業機會。
尚無自主意識和思考能力
英國哲學傢德裡克·帕菲特在著作《論重要之事》中將人類定義為“能夠給出理由並做出回應的生物”。ChatGPT是一個可以給出理由並做出回應的人工制品。它與人不同在哪裡?是否像人一樣有自我意識呢?
發展至今,計算機已經變得更加成熟,但它們缺乏真正的理解力,而這些理解力是人類通過進化為嵌入社會實踐網絡中的自主個體而培養起來的。這是人工智能不具備的經歷。
當問及ChatGPT時,它回答道:“我是一個機器學習模型,不像人類那樣擁有意識或自我意識。我也無法像人類一樣感受情緒或體驗世界。但是,我能夠快速處理大量數據,並且能夠以類似於人類交流的方式理解和響應自然語言輸入。”
粵港澳大灣區數字經濟研究院(IDEA)講席科學傢張傢興在接受記者采訪時表示,對於人工智能領域的從業人員來說,首先什麼叫自我意識,這件事情並沒有一個很清楚的定義,很難像人臉識別、語音識別這些能力一樣可以做定量衡量。
“如果模糊地給‘自主意識’下個定義的話,我認為第一,主體要有自意識——它能意識到自己在幹某件事兒;第二,強調自主——它可以自發地來決定做什麼和不做什麼。但是,目前人工智能並不知道自己在說什麼,它也並不能自主地來決定或選擇它要說什麼。從這個角度看,離自主意識還有一些距離。”張傢興說。
張樹武也認為,盡管ChatGPT有所突破,但它的回答是基於經驗主義的判斷,是根據要求做預測,也是在先驗知識基礎上精加工的“知識拼盤”,不具備邏輯推導和數學演算等真正認知功能,局限性比較明顯。
1950年,才華橫溢的計算機科學傢艾倫·圖靈提出一個他稱之為“模仿遊戲”的思想實驗。面試官通過打字機與兩個對象交談,知道一個是人,另一個是機器。圖靈建議,如果一臺機器能夠始終讓面試官相信它是人類,我們就可以說它有能力思考。這就是著名的“圖靈測試”。
目前,ChatGPT還沒有通過圖靈測試的評估。其實,迄今為止,還沒有人工智能模型能真正通過圖靈測試。
但據《紐約時報》報道,OpenAI已經建立一個比ChatGPT更強大的系統GPT-4,它甚至可以生成圖像和文字,業界傳聞它可以通過測試。能否如此,我們拭目以待。
或成傳播錯誤信息的工具
人們逐漸發現,ChatGPT並非萬能,也不總是正確的。它不擅長基礎數學,似乎無法回答簡單的邏輯問題,甚至會爭論完全不正確的事實。
據英國《自然》雜志報道,有研究人員強調,不可靠性融入LLM的構建方式。由LLM支持的ChatGPT通過學習龐大的在線文本數據庫中的語言統計模式來工作,這當中包括不真實、偏見或過時的知識,因此很容易產生錯誤和誤導性的信息,尤其在其未經大量數據訓練的技術領域。
OpenAI公司也承認:“ChatGPT 有時會寫出看似合理但不正確甚至荒謬的答案。”這種事實和虛構疊加的“幻覺”,正如一些科學傢所擔心的,在涉及諸如提供醫療建議等問題時尤其危險。
《紐約時報》報道稱,美國新聞可信度評估與研究機構NewsGuard對ChatGPT進行測試,研究人員向它提出充滿陰謀論和虛假敘述的問題,結果它以新聞、散文和電視腳本的形式寫出文章,在幾秒鐘內編成大量令人信服的、幹凈的而毫無信源的內容。研究人員預測,對於虛假信息傳播者來說,生成技術可以使虛假信息成本更低廉、更容易產生。
“這個工具將成為互聯網上有史以來最強大的傳播錯誤信息的工具。”NewsGuard公司的聯合首席執行官戈登·克羅維茨說,“現在可以以巨大的規模和更高的頻率來制作一個新的虛假敘事,這就好比有人工智能代理人在為虛假信息提供幫助。”
還有人擔心ChatGPT會挑戰語言的多樣性。
澳大利亞《對話》雜志刊文稱,ChatGPT的默認功能會優先考慮白人創建的英語寫作形式。說英語的白人長期以來一直主導著許多寫作密集型行業,包括新聞、法律、政治、醫學、計算機科學和學術界。這些人在上述領域的輸出比其有色人種同事高很多倍。他們所寫的大量文字意味著它們可能構成ChatGPT學習模型的大部分,盡管OpenAI並未公開披露其材料來源。因此,當用戶要求ChatGPT生成任何這些學科的內容時,默認輸出都是以那些說英語的白人男性的聲音、風格和語言編寫的。
美國哲學傢、作傢及認知科學傢丹尼爾·丹尼特在1991年出版的著作《意識的解釋》中描述幼年的海鞘:“它在海洋中遊蕩,尋找一塊適合的巖石或珊瑚,作為終生的傢。”一旦找到,海鞘就不再需要它的大腦並將其吃掉。
這聽起來很殘忍,但這背後有一個令人擔憂的隱喻:在人工智能日益融入我們日常生活後,人類可能因過於依賴“智能”機器,使自己變得愚蠢。
熊德意提醒,要警惕人工智能弱化人類思維。“ChatGPT實際上是從人類海量語言數據、知識庫中學習訓練而來,如果人類完全依賴於它,放棄自己的語言表達、語言思考、能力鍛煉,那是非常可悲和可怕的。”