GoogleDeepMind聯合創始人謝恩·萊格(ShaneLegg)帶領的DeepMind研究團隊發佈論文。當地時間11月4日,GoogleDeepMind聯合創始人謝恩·萊格(ShaneLegg)帶領的DeepMind研究團隊發佈論文(LevelsofAGI:OperationalizingProgressonthePathtoAGI),提出對通用人工智能(AGI)的更清晰定義,制定類似於
長期以來,AGI都是一個含義模糊的概念,粗略可以將其理解為“和人類差不多聰明”。研究團隊在論文中寫道,“我們希望提供一個共通的語言,用於比較模型、評估風險,以及衡量我們在通往AGI的道路上行進到什麼階段。”
AGI六大定義原則
研究團隊沒有用一句話概括AGI,而是提出,任何對AGI的定義都應滿足六條原則:
關註能力,而非過程。也就是說關註AGI可以完成什麼,而不是完成任務的機制。這種將關註焦點放在能力上的方式,使我們能夠將一些內容排除在對AGI的要求之外,比如實現AGI並不意味著智能體以類似人類的方式思考或理解,或實現AGI並不意味著智能體具備意識或感知(具有情感的能力),因為這些特質不僅側重於過程,而且目前無法通過公認的科學方法來衡量。
關註通用性和性能。研究團隊認為,通用性和性能是AGI的關鍵組成部分。
關註認知和元認知任務。大多數對AGI的定義側重於認知任務,可以理解為非物理任務。盡管目前機器人技術取得一些進展,但與非物理能力相比,AI系統的物理能力似乎滯後。執行物理任務的能力確實增加智能體的通用性,但我們認為這不應被視為實現AGI必要的先決條件。另一方面,元認知能力(例如學習新任務的能力或知道何時向人類請求澄清或協助的能力)是智能體實現通用性的關鍵先決條件。
關註潛力,而非部署。證明系統能夠以一定性能水平執行一組必要任務,應該足以宣佈該系統為AGI,在現實世界部署這樣的系統,不應該成為AGI定義的固有要求。
關註生態效度(Ecological Validity)。我們希望強調,選擇與人們在現實世界(即生態有效)所重視的任務相一致的任務非常重要。
關註通往AGI的路徑,而不是單一的終點。研究團隊提出AGI的五級分類,每個AGI級別都與一組明確的度量/基準相關聯,以及每個級別都引入已識別的風險和人機交互范式的變化,比如OpenAI提出的勞動替代定義就更符合“大師AGI”。
AGI五級分類
基於能力深度(性能)和廣度(通用性)將AGI分類為:非AI、初級、中級、專傢、大師、超級智能。
基於能力深度(性能)和廣度(通用性),該研究將AGI分類為:非AI、初級、中級、專傢、大師、超級智能。單個系統可能橫跨分類法中的不同級別,截至2023年9月,前沿語言模型如OpenAI的ChatGPT、Google的Bard、Meta的Llama 2在某些任務上(如短篇論文寫作、簡單編碼)表現出能力嫻熟的“中級”性能水平,但在大多數任務上(如數學能力、涉及事實性的任務)仍處於“初級”性能水平。
研究團隊認為,總的來說,當前的前沿語言模型會被視為第1級通用AI,即“初級AGI”,直到其性能水平在更廣泛的任務集上提高,滿足第2級通用AI(“能力嫻熟AGI”)的標準。
同時,研究團隊提醒道,獲得特定認知領域的更強技能,可能對AI安全產生嚴重影響,如在掌握強大的倫理推理技能之前獲得強大的化學工程知識可能是一種危險的組合。還要註意,性能或通用性級別之間的進展速度可能是非線性的。獲得學習新技能的能力可能會加速通往下一個級別的進程。
在性能和通用性的綜合方面,分級中的最高級別是ASI(人工超級智能)。研究團隊將“超級智能”性能定義為超過100%的人類。例如,研究團隊假定AlphaFold是分類法中的第5級“限定領域超人AI”,因為它在一個任務(從氨基酸序列預測蛋白質的三維結構)上的表現高於全球頂級科學傢的水平。這個定義意味著第5級通用AI(ASI)系統將能夠以沒有人類能夠匹敵的水平執行各種任務。
此外,這個框架還意味著這樣的“超人系統”可能能夠執行比AGI低級別更廣泛的任務,可以理解為其能夠實現原本人類完全不可能執行的任務。ASI可能具有的非人類技能可能包括神經界面(通過分析大腦信號來解碼思想的機制)、神諭能力(通過分析大量數據來做出高質量預測的機制),以及與動物交流的能力(通過分析它們的聲音、腦電波或肢體語言的模式等機制)。
10月底,萊格在接受科技播客采訪時表示,他仍然堅持2011年就曾公開發表的觀點——研究人員有50%的可能在2028年實現AGI。那麼這具體指的是哪一個級別?目前他還沒有明確的闡釋。