Cognition Labs推出"Devin"人工智能 可能讓軟件工程師望塵莫及


軟件工程師要小心,因為一傢人工智能初創公司創造一種名為"Devin"的自主代理,它可以取代傳統的程序員。CognitionLabs的人工智能Devin專註於類比推理而非預設答案,使其更加有效。

Introducing-Devin-the-first-AI-software-engineer-0-6-screenshot-e1710329727641-1456x752.png

當我們談論人工智能時,"字面上"的意思是一種可以與人類共存的技術,它能以難以想象的方式幫助人類完成特定任務。隨著生成式人工智能湧入主流媒體,隨後又有一些類似的發展,我們現在已經到人工智能成熟的階段,這一點在初創公司 Cognition Labs 的一項新發展中得到證實,該公司創建一個"人工智能聊天機器人"Devin,專門用於解決復雜的編程問題,比如通過編程馬拉松,以及我們成功通過編程面試。

1710355356019.png

關於 Cognition Labs 的背景情況,該公司最近受到投資者的廣泛關註,Founders Fund 和幾傢著名的投資者都為這傢初創公司的風險投資註入大量資金。現在,所謂的人工智能"軟件工程師"Devin成該公司的一個奇跡,因為Devin不是專註於自動完成代碼,而是以一種"動態"的方式解讀數據,該公司聲稱,他們的模型已經取得巨大的突破,其中涉及使用推理,而不是僅僅依賴於傳統的數據集。

1710355375676.png

令人興奮的部分來自於 Devin 的編程能力,簡而言之,這項技術確實創造一些奇跡。根據 Cognition Labs 的測試,Devin 通過自寫代碼和微調不同的 LLM 模型,成功生成 API 密鑰,這令人驚訝,因為直到現在,人工智能還沒有達到這樣的"編程"水平。在SWE-Bench基準測試中,人工智能在無人協助的情況下解決 13.86% 的問題,比 OpenAI 的 ChatGPT 解決的問題高出近 10 倍,而這甚至僅僅是個開始。

GIfOddhWkAA2PhX.jpeg

市場上出現這樣那樣的人工智能程序員後,很多人提出人工智能是否會取代人類程序員的問題,這一直是一個技術業界爭論不休的話題。不過像 Devin 這樣的工具可以為開發人員提供巨大的幫助,因為它消除對編程中更多"枯燥"元素的擔憂,讓人類可以在工作中發揮創造力。不過,隨著我們進入一個技術變得更"像人"、思考方式更"像人"的時代,人工智能可能會成為潛在裁員的一個原因。


相關推薦

2024-03-17

自主且無差錯地完成這項工作。要想把一個重大項目交給人工智能來完成,還有很長的路要走,但這仍然是一個令人著迷的開始。另一位曬出測試過程的創業者Mckay Wrigley更激動一些。在他曬出的27分鐘測試中,隻發一個GitHub連接

2023-07-08

據快科技7月7日報道,Intell預計於下半年推出14代酷睿桌面處理器。根據Intel最新的命名規則和路線圖,該處理器將以Raptor Lake S Refresh作為代號,繼續沿用酷睿i系列的命名。此前,酷睿i9-14900K已經發佈,如今爆料大神MLID披露備受

2024-04-02

成立不到半年,估值達到20億美元!AI程序員Devin的母公司CognitionAI殺瘋。CognitionAI正式成立於2023年底,種子輪融資估值就已經高達3.5億美元!創始團隊的10枚IOI金牌的“含金量”恐怖如斯。而在產品首個版本上線幾周之後,他們

2024-04-01

多媒體的頭條,也成為熱搜:一些投資者表示,Devin 代表人工智能的重大飛躍,並可能預示著軟件開發的大規模自動化之路已經開啟。Cognition 雖然神奇,但它並不是個獨苗。最近一段時間,生成式 AI 展現超乎想像的吸金能力。

2024-03-14

快科技3月14日消息,據媒體報道,初創公司Cognition AI推出全球首個AI程序員Devin,其最大突破在於大大提升計算機推理和規劃能力。據解,Devin掌握全棧技能、自學新技術、構建和部署應用程序、自主查找並修復Bug、訓練和微調自

2023-03-13

是:從技術上講,AMD研發出一款媲美RTX 4090的產品是完全可能的,但這需要600W的功耗、1600美元的價格,一般PC玩傢很難接受,因此在經過深思熟慮之後,AMD放棄。有趣的是,早先曝料稱,RTX 4090初期的功耗就高達600W,但後來降到

2022-10-14

知情人士今日稱,蘋果公司將於明年推出人們那期待已久的混合現實(MR)頭顯,支持虹膜掃描等功能,讓競爭對手Meta的最新產品望塵莫及。據兩位幫助蘋果開發MR頭顯的人士透露,蘋果的MR頭顯支持虹膜掃描功能,可對佩戴者

2023-03-15

嵌入式霄龍7002系列,最多就有64核心128線程,已經讓對手望塵莫及,這次更是一騎絕塵。AMD的數據稱,96核心的霄龍9654對比60核心的至強鉑金8490H,性能領先多達80%,能效領先多達70%。即便是64核心的霄龍9554,也可以在性能上

2024-03-17

現對AI代理能力的精確控制。在這一階段,用戶可以定義人工智能代理的數量和行為,分配特定的責任、權限和可用操作。例如,用戶可以定義一個 “開發者 ”代理和一個 “審核者 ”代理,讓它們協同工作以實現目標。根據規

2023-01-29

個年代,AMD 和英特爾可以說是相愛相殺,那時 AMD 正忙著推出 K5 處理器來和英特爾奔騰處理器競爭。吉姆這位大兄弟來 AMD 之後,負責的則是 K7 CPU 的研發,也正是從 K7 開始,AMD 把它歸屬到一個新的系列 —— Athlon 速龍 。eBay

2022-07-14

饋,目前茅臺冰淇淋比較控制貨源,而且數量也有限,不可能在全國各大零售店全面鋪開。根據市場公開信息顯示,茅臺冰淇淋目前分為三種口味,經典原味66元一個、香草味66元一個和青梅煮酒味59元一個,有些渠道的價格略有

2023-01-31

《流浪地球2》中,MOSS是搭載於最新型量子計算機550W上的人工智能,550W的強大在電影中有著多處表現。比如同時控制全球各地的數萬臺行星發動機,還有餘力進行行星發動機的建設與維護,甚至還可以模擬數字生命,使其壽命

2022-09-17

,就像上半年發佈的 iPad Air 5 一樣,但可能友商最近兩年推出的 SoC 讓蘋果覺得好像沒這必要~當然這僅僅隻是我的一個猜測,沒有任何事實依據奧,各位千萬別當真啊, 總之 iPhone 14 Pro Max 還是目前為止我們能買到的性能最強的

2024-03-17

海水溫度的地圖”。對於這個請求,小哥覺得有兩個方面可能很具有挑戰性:處理空間數據繪圖 / 可視化。知道在哪裡下載數據,而且解如何使用數據源,因為地理空間數據處理起來很麻煩。Devin 能像一個優秀的程序員一樣聰明