Google推出以Gemini模型為基礎的AlphaCode 2編程助手


與Gemini生成式人工智能模型一起,Google今天上午發佈AlphaCode2,它是GoogleDeepMind實驗室大約一年前推出的代碼生成AlphaCode的改進版。AlphaCode2實際上是由雙子座模型(Gemini)驅動的,或者至少是它的某個變種(GeminiPro)在編程競賽數據的基礎上進行微調。Google表示,至少在一項基準測試中,AlphaCode2的性能遠遠超過它的前

據Google公司稱,在Codeforces(一個編程競賽平臺)主辦的編程競賽子集中,AlphaCode 2(使用Python、Java、C++和Go等語言編碼)的平均表現優於約85%的競爭對手。相比之下,前代AlphaCode在同一子集上的平均成績僅為50%。

"我們選取最近舉行的 12 場有 8000 多人參加的競賽,這些競賽要麼來自第二組,要麼來自難度更大的'1+2'組。這使得我們總共解決 77 個問題,"AlphaCode 2 的技術白皮書中寫道。"AlphaCode 2 能在 10 次嘗試內解決 43% 的問題,接近原版 AlphaCode(25%)的兩倍。

AlphaCode 2 可以理解涉及"復雜"數學和計算機科學理論的編程難題。DeepMind 研究科學傢雷米-勒佈隆德(Rémi Leblond)在一段預先錄制的視頻中解釋說,除其他相當復雜的技術外,AlphaCode 2 還能進行動態編程。

AlphaCode 2 不僅知道何時正確實施這一策略,還知道在哪裡使用它。Leblond 說,AlphaCode 2 不僅知道何時正確實施這一策略,還知道在什麼情況下使用這一策略。考慮到需要動態編程的編程問題是最初的 AlphaCode 的一大絆腳石,這一點值得註意。

Screenshot_2023-12-05_at_10.24.30-PM-transformed-1.webp

Leblond 說:"[AlphaCode 2]需要顯示一定程度的理解、一定程度的推理和代碼解決方案的設計,然後才能實際執行,解決[一個]編碼問題。它能在從未見過的問題上完成所有這些工作"。

AlphaCode 2 解決問題的方法是,首先利用"策略模型"系列,為每個問題生成大量代碼樣本。不符合問題描述的代碼樣本會被過濾掉,而聚類算法會將"語義相似的代碼樣本"分組,以避免任何冗餘。最後,AlphaCode 2 中的評分模型會從 10 個最大的代碼樣本"集群"中各選出一個最佳候選者,這就是 AlphaCode 2 對問題的答案。

現在,所有人工智能模型都有缺陷,AlphaCode 2 也不例外。根據白皮書,AlphaCode 2 需要大量的試驗和錯誤,規模化運作的成本太高,而且在很大程度上依賴於能夠過濾掉明顯不好的代碼樣本。白皮書推測,遷移到功能更強的 Gemini 版本(如 Gemini Ultra)可能會緩解部分問題。

DeepMind 產品副總裁伊萊-柯林斯(Eli Collins)在一次簡報中暗示這種可能性。

柯林斯說:"最新結果中最讓我興奮的一點是,當程序員與[由Gemini提供支持的AlphaCode 2]協作時,通過定義代碼所遵循的某些屬性,[模型的]性能會變得更好。未來,我們將看到程序員利用高能力的人工智能模型作為協作工具,協助從推理問題到協助實施的整個軟件開發過程。"


相關推薦

2023-12-07

i 還可以用作更高級編碼系統的引擎。兩年前,Google推出 AlphaCode,這是第一個在編程競賽中達到競爭性水平的人工智能代碼生成系統。使用 Gemini 的專門版本,Google創建更先進的代碼生成系統 AlphaCode 2,它擅長解決超出編碼范圍

2023-12-07

用作更高級編程系統的引擎。Google還基於 Gemini Ultra 創建 AlphaCode 2,該模型擅長解決超出編程范圍、涉及復雜數學和理論計算機科學的競爭性編程問題。首發版本為 Gemini Pro 版:從今天開始 Google Bard 將使用 Gemini Pro 的微調版本來

2023-12-07

ha Code 2協作時,人類程序員為代碼樣例設定特定的要求,Alphacode 2的性能會進一步提升。Alpha Code 2的運作依托於強大的LLM,並結合專為競賽編程設計的先進搜索和重排機制。如下圖所示,新的模型主要由以下幾部分組成:- 多個

2024-02-10

引領人工智能先河、卻因為謹慎錯過這一波大模型先機的Google——正在變得大膽和開放,在產品和生態上迎頭趕上。北京時間2月8日21點,Google宣佈旗下最強大多模態模型Gemini(包括最大最強的Ultra、中間態的Pro、最小且匹配端側

2024-02-09

農歷春節除夕這一天,Google直接來一票大的:Bard今後統稱Gemini。通過GeminiAdvanced,即可訪問Google能力最強的原生多模態大模型GeminiUltra!去年12月,Google推出GeminiPro和GeminiNano,人們可以通過聊天機器人Bard、Pixel8Pro和三星S24系列手

2024-02-27

。歷史上,Transformers、TensorFlow、BERT、T5、JAX、AlphaFold和AlphaCode,都是谷歌為開源社區貢獻的創新。而谷歌今天在全球范圍內同步推出的Gemma,必然會再一次掀起構建開源AI的熱潮。同時也坐實OpenAI「唯一ClosedAI」的名頭。OpenAI最

2024-05-12

下周開始,矽谷科技巨頭將開啟新一輪的AI大戰。OpenAI、Google、蘋果都將押註AI助手,並發佈一系列重磅更新,你準備好?新一輪AI大戰,即將拉開序幕!下周一,OpenAI將開啟線上直播,官宣GPT-4升級,甚至還有一個超級“AI助手

2022-12-12

發表的一篇論文中,GoogleDeepMind的研究人員表示,他們的AlphaCode程序可以在標準化的編程比賽中跟上普通人類程序員的步伐。研究人員在本周的《科學》雜志上報告說:"這一結果標志著人工智能系統首次在編程比賽中取得競

2024-04-09

去年GoogleI/O大會的一個重要主題就是推出大量利用人工智能幫助完成工作的工具和功能。對於開發人員來說,StudioBot就是最好的例子,它是AndroidStudio內置的人工智能聊天機器人,可以回答問題並提供直接的編程協助。今天,Googl

2024-02-22

昨日晚間,Google毫無預兆地發佈開源模型Gemma,直接狙擊Llama2,繼通過Gemini拳打OpenAI後,試圖用Gemma腳踢Meta。不同於Gemini的“全傢桶”路線,Gemma主打輕量級、高性能,有20億、70億兩種參數規模,能在筆記本電腦、臺式機、物聯

2024-02-11

Gemini的發佈,表明“Google真正加入人工智能競賽”,這是自ChatGPT發佈以來,第一次有另一傢公司的大模型可以與最先進的模型相媲美。隨著Google在AI軍備競賽中急起直追,“有史以來最強大模型”GeminiAdvanced終於上線,AI愛好者

2023-05-11

5月10日周三舉行的Google年度開發者大會GoogleI/O2023上,Google亮出人工智能(AI)領域開發的最新成果。和此前媒體曝光的消息一致,本次Google正式發佈新的通用大語言模型PaLM2。PaLM2是驅動AI機器人Bard的模型的升級版,可以生成多

2023-03-31

pMind先後發佈幾款令人世人驚艷的人工智能,比如AlphaGO、AlphaCode、AlphaFold。可以說,風頭遠遠超過Google。自ChatGPT發佈後,Google大腦時不時更新一些進展,然而DeepMind一直還公佈近來的大動作。而現在,Alphabet這兩個人工智能實驗

2023-11-11

OpenAI和Google搶人搶瘋,一邊給出500萬到100萬美元的天價年薪,另一邊許諾自己的offer薪水更高。而國內的AI博士也是遭到瘋搶,還沒畢業就要被幾百萬年薪挖走。搶瘋,搶瘋!OpenAI和Google的搶人大戰,已經進入白熱化。OpenAI給Googl