人工智能的下一前沿陣地:AlphaCode可以與普通程序員的技能相媲美


人工智能軟件程序在進行對話、贏得棋盤遊戲和生成藝術品方面的能力正在變得令人震驚--但在創造軟件程序方面呢?在最新發表的一篇論文中,GoogleDeepMind的研究人員表示,他們的AlphaCode程序可以在標準化的編程比賽中跟上普通人類程序員的步伐。

Fig_04_Final.jpg

研究人員在本周的《科學》雜志上報告說:"這一結果標志著人工智能系統首次在編程比賽中取得競爭性的表現。"

雖然現在還沒有必要對天網敲響警鐘,但DeepMind的代碼生成系統在Codeforces平臺上最近的編程競賽的模擬評估中獲得54.3%的平均排名--這是一個非常"平均"的平均數。

"競爭性編程是一項極其困難的挑戰,我們現在的水平(在10次提交中解決約30%的問題)與頂級程序員(在一次提交中解決>90%的問題)之間存在巨大差距,"DeepMind研究科學傢李宇佳(科學論文的主要作者之一)稱,"剩下的問題也明顯比我們目前解決的問題更難。"

盡管如此,該實驗指出人工智能應用的一個新的前沿。微軟也在探索這一領域,它有一個名為Copilot的代碼建議程序,通過GitHub提供。亞馬遜也有一個類似的軟件工具,叫做CodeWhisperer。

西雅圖艾倫人工智能研究所的創始首席執行官兼AI2孵化器的技術總監奧倫-埃齊奧尼(Oren Etzioni)表示,新發表的研究強調DeepMind在應用被稱為大型語言模型或LLM的AI工具方面的主要地位。

"這是一個令人印象深刻的提醒,OpenAI和微軟並沒有壟斷LLMs的驚人功績,"Etzioni在一封電子郵件中說。 "遠非如此,AlphaCode比GPT-3和微軟的Github Copilot都要好。"

AlphaCode因其編程方式而引人註目,也因其編程質量而引人註目。"該系統最令人驚訝的地方也許是AlphaCode不做什麼。AlphaCode不包含關於計算機代碼結構的明確的內置知識。相反,AlphaCode依靠一種純粹的'數據驅動'方法來編寫代碼,通過簡單地觀察大量的現有代碼來學習計算機程序的結構,"卡內基梅隆大學的計算機科學傢J.Zico Kolter在一份關於該研究的科學評論中寫道。

AlphaCode使用一個大型的語言模型,根據對問題的自然語言描述來構建代碼。該軟件利用大量的編程問題和解決方案的數據集,加上GitHub上的一組非結構化代碼。AlphaCode為手頭的問題生成數以千計的擬議解決方案,對這些解決方案進行過濾,以拋出那些無效的解決方案,將幸存的解決方案歸為一組,然後從每組中選擇一個例子提交。

這種程序有可能"創造"出正確的代碼,這似乎令人驚訝。Kolter說,可以想象,AlphaCode的方法可以與更多的結構化機器語言方法相結合,以提高系統的性能。

他寫道:"如果將數據驅動的學習與工程知識相結合的'混合'ML方法可以在這個任務上表現得更好,就讓他們試試吧。AlphaCode鑄就這一點。DeepMind正在繼續完善AlphaCode。雖然AlphaCode是從~0%到30%的重要一步,但仍有很多工作要做,"

在尋求創建代碼生成軟件的過程中,人工智能有很大的空間,期望快速迭代和改進。Etzioni說:"我們離生成性人工智能的'大爆炸'隻有10秒鐘。許多在更廣泛的數據上的令人印象深刻的產品,包括文本和結構化的數據,很快就會到來,"Etzioni說。"我們正在狂熱地試圖弄清楚這項技術能走多遠。"

隨著工作的進行,AlphaCode可能會激起關於人工智能的承諾和潛在危險的長期辯論,就像DeepMind的AlphaGo程序在展示基於機器的對圍棋遊戲的掌握時那樣。而且,編程並不是人工智能的快速發展引起爭議的唯一領域。

一個名為ChatGPT的開放性人工智能程序在科技界引發一股熱潮,因為它能夠以詳細的答案和文件來回應信息請求,而這些答案和文件可以幫助我們更好地理解人工智能。


相關推薦

2023-12-07

與Gemini生成式人工智能模型一起,Google今天上午發佈AlphaCode2,它是GoogleDeepMind實驗室大約一年前推出的代碼生成AlphaCode的改進版。AlphaCode2實際上是由雙子座模型(Gemini)驅動的,或者至少是它的某個變種(GeminiPro)在編程競賽

2023-02-02

據報道,谷歌正在測試新的人工智能聊天產品,甚至有可能對未來的公開產品發佈計劃產生影響,其中包括新的聊天機器人以及與聊天機器人相融合的全新搜索引擎界面。谷歌將這個項目歸入該公司的Atlas雲計算部門,以回應近

2023-02-14

”對此,微軟創始人蓋茨日前在接受媒體采訪時表示:“人工智能不會產生如此威脅,教師不會減少,醫生也不會減少。從長遠來看,效率的提高會使得人們的工作時間減少。因為當人工智能接管日常任務時,員工可以專註於更

2024-02-11

Gemini的發佈,表明“Google真正加入人工智能競賽”,這是自ChatGPT發佈以來,第一次有另一傢公司的大模型可以與最先進的模型相媲美。隨著Google在AI軍備競賽中急起直追,“有史以來最強大模型”GeminiAdvanced終於上線,AI愛好者

2023-12-07

速人類進步和改善生活的機會。我相信我們現在所看到的人工智能轉變將是我們一生中最深刻的轉變,遠遠大於之前向移動或網絡的轉變。人工智能有潛力為世界各地的人們創造從日常生活到非凡的機會。它將帶來新一波的創新

2023-04-27

自然語言處理界的大牛。某種程度上,Hugging Face是在構建人工智能領域的“GitHub”,讓其成為一個由社區開發者驅動的開源平臺。人工智能“iPhone時刻”已到?據證券時報4月26日報道,有關生成式AI對行業的影響,英偉達創始人

2022-06-22

相信,英國是區塊鏈創新和金融市場加密貨幣更廣泛實施的下一個前沿陣地,"Tether首席技術官Paolo Ardoino在聲明中說。"我們希望通過向全世界的加密貨幣用戶提供由最大的穩定幣發行商發行的以英鎊計價的穩定幣來幫助

2022-09-16

為《Spinoff》的年度出版物中強調這一點。人類太空探索的下一個偉大空間前沿是火星。盡管NASA已經創造一個受刺激的火星棲息地,SpaceX還計劃在未來幾年內向火星執行載人任務並在這顆紅色星球上建立基地,但它對人類生命來

2024-04-17

近日,由李飛飛聯合領導的斯坦福大學以人為本人工智能研究所(StanfordHAI)發佈《2024年人工智能指數報告》(ArtificialIntelligenceIndexReport2024)。這份長達300多頁的報告是StanfordHAI發佈的第7份AIIndex研究,追蹤2023年全球人工智能的

2024-01-31

本。相反,微軟可能會在 2024 年再次更新 Windows 11,增加人工智能功能,而 Windows 12 則會在 2025 年出現,並帶來更大的平臺變化,比如可以與 ChromeOS 相媲美的操作系統版本。

2022-10-24

WSA的v1正式版將在31個國傢和地區上線,支持超過5萬個App的下載與安裝。這些App在使用上能夠與普通的Windows應用程序相媲美,不會對用戶造成過大的使用割裂感。不過,雖然已經正式推出,但現階段的WSA仍存在部分功能的缺失,

2024-08-12

戰中展現出媲美人類業餘乒乓球選手的競技水平,標志著人工智能在體育運動領域的又一重大突破。在知名預印本平臺arXiv上,研發團隊詳盡闡述這一裡程碑式的成就。這款機器人不僅是首個能在乒乓球比賽中達到人類業餘選手

2023-02-27

除研究血糖追蹤技術,XDG還致力於開發下一代顯示技術、人工智能以及幫助眼疾患者的AR/VR頭顯功能。這個團隊最初是在阿薩斯的領導下成立,旨在探索低功耗處理器技術和下一代智能手機電池,這些努力目前仍在繼續開展。XDG

2022-10-24

礎技術領域,程序員隻要把技術棧做得比較深入,其實是可以越老越吃香的。“IT行業本身確實迭代快,但如果你掌握一些底層的東西後,你會發現其實Rust、Java等語言之間的差別是非常小的,不同領域間的遷移學習能力其實也