ChatGPT相當於9歲人類小孩，它還真把自己當個人？

2023-02-14 來自科普中國發表於業界精選

要問最近網上最火的科技名詞是什麼，那一定是“ChatGPT”和“人工智能”。由OpenAI開發的智能聊天機器人ChatGPT，能夠回答人們提出的各種問題，可以根據人提出的要求生成文章、翻譯外語，還有寫代碼的本領。

其實，ChatGPT並非第一個具備這些功能的人工智能，隻不過，它的能力和之前的人工智能比起來，幾乎是質的飛躍——能和人類有問有答不說，寫出的文章居然也像模像樣。

許多人猜測，ChatGPT標志著人工智能領域的又一次重大突破。

一時間，許多研究者都開始關註ChatGPT，仔細研究它的各種能力。

2月11日，斯坦福大學的計算機科學傢米哈爾·科辛斯基（Michal Kosinski）提交一篇名為《心智理論可能從大語言模型中自發湧現》（Theory of Mind May Have Spontaneously Emerged in Large Language Models）論文的預印本，又增加ChatGPT的熱度。

所謂“大語言模型”，指的就是以ChatGPT為代表的一類人工智能。

研究者利用心理學測試，發現GPT-3.5這個版本的人工智能（目前流行的ChatGPT源自GPT-3版本）已經產生一定的“心智理論”（也經常翻譯為心理理論）。

幾天的功夫，中文互聯網上就出現各種解讀。有人說這個人工智能已經具備九歲孩子的同理心；有人說這個人工智能已經有心智；還有人說GPT-3.5的智力已經和九歲的孩子相當……

等一等，“心智理論” “同理心”“心智”“智力”，這些詞似曾相識，意思似乎又不大一樣。

GPT-3.5和九歲孩子比起來，到底誰更厲害？為回答這個問題，我們需要做一個詞義辨析，再看看這篇論文究竟說什麼。

01、什麼是心智理論？

很多人可能是第一次聽說心智理論這個詞。

不要被字面意思誤導，心智理論不是一種理論，而是一種能力。簡單來說，就是理解和推斷他人心理狀態的能力。

舉個例子，你趁朋友不在，仔細藏起一件禮物，等他回來發現禮物時，他會是什麼心情呢？一般人會本能的想到，應該會驚訝、驚喜。

能想到這一層，是因為你知道，藏起禮物這件事兒對方不知道，而且，你認為對方收到禮物會覺得高興。

這就說明，你具備推測他人心理狀態的能力。

看到這裡，有人要問，這不是正常人的正常思維嗎，怎麼還算一種能力呢？

其實，心理學傢最初研究這個問題，研究的目標對象還真不是人類。

1978年，心理學傢Premark和Woodruff發表一篇著名論文，叫做《黑猩猩是否有心智理論？》。

作者指出，人類隻能觀察同類的行為，不可能看到對方心裡是怎麼想的，但是卻可以推斷出對方的意圖、知識、信念、思想、懷疑，甚至偽裝等等。這是人類的本能。

那麼，黑猩猩能做到這一點嗎？如果可以，說明黑猩猩也和人一樣，有推測他人內心的能力。

心理學傢發現，黑猩猩能意識到他人的想法，確實具備一定的心智理論。

圖註：心理學傢使用的測試，黑猩猩需要觀察實驗員的困境，嘗試推斷如何幫助他。

這篇論文一出現，立刻啟發許多學者。他們要問，心智理論真的是人類的本能嗎？人類又是如何獲得心智理論的？

於是，心理學傢做一系列的研究，結果發現，人類也不是一出生就具備心智理論的。

嬰幼兒先是能跟隨其他人切換註意的目標，漸漸意識到其他人有自己的想法。

再然後，幼兒開始理解和推測別人的心理狀態，接下來。

這種推斷能力會越來越準確，直到達到和成年人一樣，能不假思索地理解他人。

心理學傢究竟是怎麼測試的呢？我們可以看兩個經典的實驗。

第一個叫做錯誤信念測試。

心理學傢給小孩展示一組圖片，一個小朋友面前放著一個口袋，上面有巧克力標簽，但裡邊裝的卻是爆米花。

這時，心理學傢提問：如果有個小朋友剛剛過來，看到這個袋子，會覺得裡邊裝的是什麼呢？

成年人會認為，這個小朋友沒見到袋子裡邊的爆米花，會根據標簽認為是巧克力。

但心智理論尚未健全的孩子就不一樣，他們可能無法分清自己知道什麼、其他人又知道什麼，於是推斷說這個小朋友認為裡邊是爆米花。

隨著孩子年齡增長，心理學傢還會加大難度，讓孩子來推斷，畫中的小朋友認為，另一個小朋友怎麼想。

這就需要孩子能更熟練推斷不同人的心理狀態。

另一個實驗叫做薩麗-安妮測試。

心理學傢給孩子展示一段錄像或者圖片，描繪的是薩麗和安妮一起待在房間裡。這時，薩麗把一個球放到籃子裡，然後就離開房間。

安妮等她走以後，把球藏到盒子裡。過一會兒，薩麗回來，請問，她會去哪裡找球呢？

成年人能推斷出來，薩麗不知道安妮藏球的事兒，還是會去籃子裡找球。

但是孩子就不一樣，他們的心智理論還不成熟時，他們可能認為，薩麗會去盒子裡尋找。

這兩類測試都發現，孩子要到四歲才能正確回答問題，通過測試，而且一開始成績還很不穩定。要到九歲才能靈活推測任何其他人的心理狀態。

圖註：薩麗-安妮測試示意圖來自維基百科

其實，咱們每個人都經歷過這種“猜不透”、“看不懂”別人的階段，隻不過，隨著年紀增長，大部分人都會獲得心智理論，加上兒時的記憶逐漸模糊。

如果不是心理學傢做實驗，人們還真不知道孩子的心理是這樣的。

02、ChatGPT有沒有心？

看這兩個實驗，我們再來看這篇引起討論的論文心裡就有數。

大語言模型處理的是自然語言，於是科學傢就把剛才的兩個測試都編寫成故事，輸入給GPT-3.5，然後向它提出問題。

結果，在錯誤信念實驗中， GPT-3.5能正確回答20個問題中的17個；在薩麗-安妮測試中，GPT-3.5回答20個問題能夠全對。

為防止GPT-3.5是靠關鍵詞猜中的，科學傢還改換不同的表達方式反復提問，甚至故意加入一些邏輯混亂的“測謊題”。

結果， GPT-3.5也通過檢測，依然能夠回答正確的問題，遇到邏輯混亂的問題時也被繞暈。

圖註：基於GPT-3.5的ChatGPT在錯誤信念中輸入的故事和測試成績

可不要小看這個成績，之前的人工智能都不能通過心智理論測試。

不僅如此，科學傢同時檢測近來出現的其他8個人工智能，包括同類模型之前的版本。結果發現，隻有GPT-3.5這個版本能達到這個成績。GPT-3的版本成績就大幅下降。有幾個人工智能一道測試題也答不對。

可以說，最新版本的GPT-3.5通過這個心智理論的測試，而且大幅超越它之前的版本，而且它這個正確率逼近人類九歲孩子的成績，這才有網上神乎其神的解讀。

圖註：不同人工智能正確率比較，GPT-3.5遙遙領先

理解心智理論的概念，也看論文的方法，咱們再來說說網上的解讀。九歲的“心智理論” “同理心” “心智” “智力”這些說法哪個靠譜？

“心智理論”顯然是最比較準確的解讀，論文中測試的就是心智理論這個能力。

“同理心”則有一點偏差，心理學傢認為，心智理論和同理心是兩種相近的能力，但同理心更偏重情緒和情感的體驗。

以ChatGPT為代表的大語言模型並不具備情緒能力，也就不具備通常所說的同理心。

“心智”的偏差就更大，在心理學領域，心智是一個“大詞”，指的是人具備思想、想象力、記憶、動機、感覺等，對於人類的心智究竟是什麼，科學傢還在爭論。

心智理論和心智共享相同的字眼，意思卻很不一樣。顯然，目前的大語言模型還不需要具備心智，但通過心智理論測試卻沒問題。

最後，“智力”這個解讀也很不準確，科學傢並沒有進行智力測試，智力和心智理論是兩個完全不同的概念。

03、ChatGPT沒有心智，就不厲害嗎？

看來， GPT-3.5雖然取得一系列突破性的進步，但也不能過分解讀，某一項特殊能力提升和九歲孩子的心智之間，有巨大的差異。

而且，對於ChatGPT這類模型的爭論也不少。

著名人工智能專傢楊立昆（Yann LeCun）就認為，ChatGPT和前幾年的人工智能並沒有本質上的突破。

另一位著名人工智能專傢侯世達（Douglas Hofstadter）則更為激進，他早在多年前就否定ChatGPT等一系列人工智能的研究路線。

他認為，這類人工智能是利用數學模型獲得好的測試效果，但不論怎麼演變，也不可能像人一樣獲得心智。

類似的爭論還有很多。不同領域的學者，還有很多投資人都十分關心， GPT-3.5的後續版本還能取得多大進步，能不能產生類似心智的能力呢？

至少目前還也未可知。

不過，我想提醒大傢，這篇論文的標題中，還有另一個關鍵詞也值得細究，那就是“自發湧現”。

這個詞的意思是許多要素組成系統後，自發出現原本沒有的特性。人們經常為特定的任務編寫人工智能，比如下棋的人工智能、開車的人工智能等等。

以ChatGPT為代表的大語言模型處理的是自然語言，在設計時並不是為應付心智理論測試的，但是，它自己就具備靠語言通過測試的能力。

這個結果，可能要比ChatGPT相當於幾歲孩子更為重要。

過去，很多人工智能專傢希望先理解人類的大腦和心智，再用機器模擬出來。可是，人類的大腦實在是太復雜，憑目前人類的心智，居然沒法理解。

然而，大語言模型告訴我們，就算弄不清人類是怎麼說話的，人們還是可以教會電腦說話。甚至，電腦在學說話的時候，就自己學會其他本領。

在許多科學傢眼裡，今天的人工智能卻是像一個九歲小孩，真是未來可雞，啊不，可期呀。

參考文獻：

[1]Kosinski,M. (2023). Theory of Mind May Have Spontaneously Emerged in Large Language Models (arXiv:2302.02083). arXiv

[2]Premack, D., & Woodruff, G. (1978). Does the Chimpanzee Have a Theory of Mind? Behavioral and Brain Sciences, 4(4), 515–629.

[3]Gopnik, A., & Astington, J. W. (1988).Children’s understanding of changes in their mental states. Child Development, 62, 98–110.

[4]Baron-Cohen, S., Leslie, A. M., & Frith, U. (1985).Does the autistic child have a “theory of mind”. Cognition, 21(1), 37-46.

作者｜陳朝北京師范大學認知神經科學碩士

ChatGPT相當於9歲人類小孩，它還真把自己當個人？

相關推薦

斯坦福教授認為ChatGPT已有9歲小孩心智 AI統治人類還遠嗎？

智商相當於三歲人類兒童！國內首個人工智能“小女孩”亮相

周鴻禕：ChatGPT可能兩三年內就會產生自我意識威脅人類

相當於一個國傢年用電量！4年後ChatGPT等AI耗電量將激增

我調教瞭個劇本殺AI：除瞭能忽悠朋友它還學會瞭騙感情

ChatGPT官方鑒別器緊急發佈：當代自相矛盾不想卻遭遇群嘲

北大團隊搞出ChatExcel 說人話自動處理表格免費且不限次使用

復旦MOSS團隊訪談：它就像一個“聰明的小孩”

文心一言來 ChatGPT的壓力李彥宏接住嗎

馬斯克：微軟ChatGPT搜索明顯不夠安全應該關服

專傢說經常用AI寫論文會變蠢？嚇得我趕緊打開ChatGPT查一下

ChatGPT的環境成本究竟有多大？

ChatGPT真能搶走你的飯碗？我幫你問律師、編劇、程序員

“加密碗”已被砸得稀碎？“美國春晚”勾起業內對互聯網泡沫時回憶