近日,由李飛飛聯合領導的斯坦福大學以人為本人工智能研究所(StanfordHAI)發佈《2024年人工智能指數報告》(ArtificialIntelligenceIndexReport2024)。這份長達300多頁的報告是StanfordHAI發佈的第7份AIIndex研究,追蹤2023年全球人工智能的發展趨勢。
Stanford HAI 官方介紹道,‘這是我們迄今為止最全面的報告,而且是在人工智能對社會的影響從未如此明顯的重要時刻發佈的。’
Stanford HAI 研究項目主任 Vanessa Parli 表示,‘我認為最令人興奮的人工智能研究優勢是將這些大型語言模型與機器人或智能體(agent)相結合,這標志著機器人在現實世界中更有效地工作邁出重要一步。’
附上《2024 年人工智能指數報告》下載地址:
https://aiindex.stanford.edu/wp-content/uploads/2024/04/HAI_AI-Index-Report-2024.pdf
與往年不同,Stanford HAI 今年擴大研究范圍,更廣泛地涵蓋人工智能的技術進步、公眾對該技術的看法等基本趨勢。新報告揭示 2023 年人工智能行業的 10 大主要趨勢:
1.人工智能在某些任務上勝過人類,但並非在所有任務上
人工智能已在多項基準測試中超越人類,包括在圖像分類、視覺推理和英語理解方面。然而,它在競賽級數學、視覺常識推理和規劃等更復雜的任務上依然落後於人類。
2.產業界繼續主導人工智能前沿研究
2023 年,產業界產生 51 個著名的機器學習模型,而學術界隻貢獻 15 個。2023 年,產學合作還產生 21 個著名模型,創下新高。此外,108 個新發佈的基礎模型來自工業界,28 個來自學術界。
3.前沿模型變得更加昂貴
根據 AI Index 的估算,最先進的人工智能模型的訓練成本已經達到前所未有的水平。
例如,OpenAI 的 GPT-4 估計使用價值 7800 萬美元的計算資源進行訓練,而 Google 的 Gemini Ultra 的計算成本則高達 1.91 億美元。
相比之下,幾年前發佈的一些最先進的模型,即原始 transformer 模型(2017 年)和 RoBERTa Large(2019 年),訓練成本分別約為 900 美元和 16 萬美元。
4.美國成為頂級人工智能模型的主要來源國
2023 年,61 個著名的人工智能模型源自美國的機構,超過歐盟的 21 個和中國的 15 個。
美國也仍然是人工智能投資的首選之地。2023 年,美國在人工智能領域的私人投資總額為 672 億美元,是中國的近 9 倍。
然而,中國依然是美國最大的競爭對手,中國的機器人安裝量居世界首位;同樣,世界上大多數人工智能專利(61%)都來自中國。
5.嚴重缺乏對 LLM 責任的可靠和標準化評估
AI Index 的最新研究顯示,負責任的人工智能嚴重缺乏標準化。包括 OpenAI、 Google 和 Anthropic 在內的領先開發商主要根據不同的負責任人工智能基準測試他們的模型。這種做法使系統地比較頂級人工智能模型的風險和局限性的工作變得更加復雜。
6.生成式人工智能投資激增
盡管去年人工智能私人投資整體下降,但對生成式人工智能的投資激增,比 2022 年(約 30 億美元)增長近八倍,達到 252 億美元。
生成式人工智能領域的主要參與者,包括 OpenAI、Anthropic、Hugging Face 和 Inflection,都獲得一輪可觀的融資。
7.數據顯示,人工智能讓打工人更有生產力,工作質量更高
2023 年,多項研究評估人工智能對勞動力的影響,表明人工智能可以讓打工人更快地完成任務,並提高他們的產出質量。
這些研究還表明,人工智能有可能縮小低技能和高技能工人之間的技能差距。還有一些研究警告說,在沒有適當監督的情況下使用人工智能可能會起到負面作用。
8.得益於人工智能,科學進步進一步加速
2022 年,人工智能開始推動科學發現。然而,2023 年,與科學相關的更重要的人工智能應用啟動——使算法排序更高效的 AlphaDev、促進材料發現過程的 GNoME、可在一分鐘內提供極其準確的 10 天天氣預報的 GraphCast、成功對 7100 萬種可能的錯義突變中的約 89% 進行分類的 AlphaMissence。
如今,人工智能現在可以完成人類難以完成的、但對解決一些最復雜的科學問題至關重要的粗暴計算。在醫療方面,新的研究表明,醫生可以利用人工智能更好地診斷乳腺癌、解讀 X 射線和檢測致命的癌癥。
9.美國的人工智能法規數量急劇增加
2023 年,全球立法程序中有 2175 次提及人工智能,幾乎是上一年的兩倍。美國人工智能相關法規的數量在過去一年大幅增加。2023 年,與人工智能相關的法規有 25 項,而 2016 年隻有 1 項。
僅去年一年,人工智能相關法規的總數就增長 56.3%。其中一些法規包括生成式人工智能材料的版權指南和網絡安全風險管理框架。
10.人們對人工智能的潛在影響有更深刻的認識,同時也更焦慮
來自市場研究公司 Ipsos 的一項調查顯示,在過去一年中,認為人工智能將在未來 3-5 年內極大地影響他們生活的人,比例從 60%上升到 66%。此外,52% 的人對人工智能產品和服務表示焦慮,比 2022 年上升 13 個百分點。
在美國,來自皮尤研究中心(Pew)的數據顯示,52% 的美國人表示對人工智能的擔憂多於興奮,這一比例比 2022 年的 38% 有所上升。
附:來自AI Index 聯合主任 Ray Perrault 的一封信
十年前,世界上最好的人工智能系統也無法以人類的水平對圖像中的物體進行分類。人工智能在語言理解方面舉步維艱,也無法解決數學問題。如今,人工智能系統在標準基準上的表現經常超過人類。
2023 年,人工智能進步加速。GPT-4、Gemini 和 Claude 3 等先進模型展示出令人印象深刻的多模態能力:它們可以生成數十種語言的流暢文本,處理音頻,甚至可以解釋備忘錄。
隨著人工智能的進步,它也越來越多地進入我們的生活。公司競相打造基於人工智能的產品,普通大眾也越來越多地使用人工智能。但是,當前的人工智能技術仍然存在重大問題。它無法可靠地處理事實、進行復雜的推理或解釋其結論。
人工智能面臨兩個相互關聯的未來。第一個,技術不斷改進,應用日益廣泛,對生產力和就業產生重大影響。人工智能的用途有好有壞。第二個,人工智能的應用受到技術局限的制約。
無論是哪一種,政府都越來越關註。政府正在積極參與,鼓勵人工智能的發展,比如資助大學研發和激勵私人投資。政府還致力於管理潛在的不利因素,如對就業的影響、隱私問題、錯誤信息和知識產權。
在技術方面,今年的 AI Index 報告稱,2023 年全球發佈的新大型語言模型數量比上一年翻一番。三分之二的模型是開源的,但性能最高的模型來自擁有封閉系統的行業參與者。
Gemini Ultra 成為首個在大規模多任務語言理解(MMLU)基準上達到人類水平的 LLM;自去年以來,模型在該基準上的性能表現提高 15 個百分點。此外,GPT-4 在綜合語言模型整體評估(HELM)基準上取得令人印象深刻的 0.97 平均勝率分數。
雖然全球對人工智能的私人投資連續第二年減少,但對生成式人工智能的投資卻急劇上升。財富 500 強企業財報電話會議中提及人工智能的次數比以往任何時候都多,而且新的研究表明,人工智能明顯提高打工人的生產率。
在政策制定方面,全球在立法程序中提及人工智能的次數前所未有。美國監管機構在 2023 年通過的人工智能相關法規比以往任何時候都多。盡管如此,許多人仍對人工智能生成深度偽造等能力表示擔憂。公眾對人工智能有更多的認識,研究表明,他們的反應也是焦慮的。