Gemini修改bug讓網友大開眼界:錄網頁視頻把代碼庫甩給它就行


X一小夥分享,為測試Gemini1.5Pro,自己在編寫一個網頁的代碼時故意留3個bug,並分別錄制網頁bug視頻。接著把代碼庫打包成文件連同視頻一起輸給Gemini1.5Pro,提示它找到並修復代碼中的所有bug,且要提供一個簡要指南以及所做更改的說明。

沒想到,Gemini 1.5 Pro還真就分分鐘正確識別並修復每一個bug。


小夥將這種玩法po出來後熱度不斷攀升,網友們紛紛一鍵三連,轉贊收藏量過萬。

其本人還在評論區強調,“這隻是一個簡單的例子,也將是它最差的表現”,Gemini這小汁前途不可限量啊。


有網友表示想起來一件事覺得有趣:英偉達黃院士前段時間曾公開表示“孩子們以後不需要學編程”,那時候還有很多人反對稱“AI不會取代程序員”


但甭管怎麼說,AI可以給程序員提供幫助是有目共睹的。


接下來我們展開來看Gemini 1.5 Pro修復bug的經過。

事件經過

正如開頭提到的,網友先是在編寫網頁代碼時故意寫錯3處:


這就導致網頁上的一些功能操作無法正常運行,於是小夥分別拍攝3處無法正常運行的視頻,每個視頻十幾秒。

然後將視頻連同代碼庫一起輸給Gemini 1.5 Pro。

prompt為:

Fix the bugs in my code.Create a simple markdown guide for me to fix them,and then write the actual code to fix the bugs.I need the full code like it’s for a complete PR so I am make the changes.(修復我代碼中的bug,為我創建一個簡單的Markdown指南以修復bug,然後編寫實際的代碼來修復。我需要完整的代碼,就像它是為一個完整的Pull Request一樣,這樣我才能進行更改。)


隨後,Gemini 1.5 Pro立刻準確識別3個bug:

點擊一個待辦事項並不會將其標記為完成/未完成

主題切換器不會切換主題

點擊登錄按鈕不會觸發任何操作


緊接著就分別給出修復方案,附帶代碼:


小夥仔細對照自己敲的代碼,確認Gemini 1.5 Pro給出的答案是正確的:


小夥還強調,這3個bug在代碼庫文件中其實離著很遠,這也就意味著Gemini 1.5 Pro確實讀完完整的上下文。


“想要訪問權限”

網友看到這一系列操作後激動搓手,直呼想要Gemini 1.5 Pro訪問權限:



除坐等外,還有網友表示用GPT-4幫忙修復代碼也很好使,順帶暢想一下GPT-5:

接下來可能是實時交互?或許能與GPT-5進行屏幕共享?


而另一邊已經獲得訪問權限的網友早就玩嗨。

比如,一次性輸給Gemini 1.5 Pro最新的10篇論文,讓它從中找到一個作者的電子郵件地址。

結果Gemini 1.5 Pro第一次就成功找到:


然後又讓Gemini 1.5 Pro從超360000token的《哈利·波特與鳳凰社》整本書中找到一句話的說話人,Gemini 1.5 Pro也成功找到。



測試繼續上難度,一次性輸入三本書,Gemini 1.5 Pro最後用時約1分鐘再次成功找到對應的說話人:


驚訝之餘,這位測試者總結Gemini 1.5 Pro的邏輯推理能力:

對於常規提示,接近GPT-4的性能。

但當我添加數十個例子時,Gemini的性能在提升,似乎沒有上限。多示例提示成為新的微調方法。


沃頓商學院教授Ethan Mollick也來整活。輸給Gemini 1.5 Pro一本352頁的《太空60年》規則手冊,約250000token,然後要求它扮演一個角色。

即使說明書分散在很多頁上,而且非常復雜,但Gemini“似乎明白”:


Ethan Mollick教授表示,對所有其他AI進行這項測試都是失敗的,隻有Gemini 1.5 Pro成功。


這位網友想要編譯整個X算法的代碼存儲庫並將其上傳到Gemini 1.5 Pro,正在線向網友征集想問的問題。


隻見編譯完成後,共310489token,Dogan Ural向Gemini 1.5 Pro提出網友們關心的一系列問題,比如“在Twitter上擴大或者減少影響力的前5件事是什麼?”

Gemini 1.5 Pro很輕松地給出這樣嬸兒的答案:


你還見過哪些有趣的玩法?歡迎評論區分享~


相關推薦

2024-02-16

剛剛,我們經歷LLM劃時代的一夜。Google又在深夜發炸彈,GeminiUltra發佈還沒幾天,Gemini1.5就來。卯足勁和OpenAI微軟一較高下的Google,開始進入高產模式。自傢最強的Gemini1.0Ultra才發佈沒幾天,Google又放大招。就在剛剛,GoogleDeepMind

2024-06-30

6月29日消息,據國內多傢媒體報道,有網友發帖稱,西湖邊的柳樹上出現一個個紅色小芽。從照片可以看出,不光是柳樹的樹幹,地面裸露出來的根莖上也有。據悉,這是柳樹的氣生根,受濕潤空氣或高溫刺激,植物會長出氣生

2024-02-18

Google下一代大模型,無預警降臨。Gemini1.5,除性能顯著增強,還在長上下文理解方面取得突破,甚至能僅靠提示詞學會一門訓練數據中沒有的新語言。此時距離去年12月Gemini1.0發佈,還不到3個月。現在僅僅中杯1.5 Pro版就能越級

2023-03-15

到解決辦法。在API方面,GPT-4還開放一個使用功能,允許修改“系統提示”。之前ChatGPT的回答總是冗長而平淡,這是因為系統提示中規定“你隻是一個語言模型……你的知識截止於2021年9月”。現在通過修改這句話,GPT-4就可以

2024-03-17

哥把要求顯示的位置改為北美。總結小哥沒有給出 Devin 修改 Bug 的結果,隻是初步總結用 Devin 開發的第一個網站的使用體驗。先說優點:Devin 產品化做得很好,他給人的使用體驗是一個完整的產品而不是隻是一個簡單的對話框

2023-03-23

能:直接寫代碼解釋一段你看不懂的代碼理解報錯信息、修改bug甚至是進行單元測試……多姆克表示:有GPT-4加持的Copilot X,將讓AI能力存在於代碼生命周期的每一步,從根本上影響開發人員的體驗。這究竟是程序員的福音還是

2023-04-28

生們表示,這挖機做出來的燒烤別有一番風味。留言區,網友紛紛評論:泰酷辣挖機還能這麼用,饞饞就不能給我吃一串嗎

2024-03-28

成一個國產大模型的名字,還在我的首頁刷屏……像B站網頁端,我滑下來10 個廣告有9個都是它,而且這個情況持續很多天。因為 Kimi 用著不賴,加上免費,最近還挺火的,甚至服務器都已經跟不上用。其實世超用它已

2024-03-04

值得註意的是谷歌並不準備在常規情況下使用 WebView API 修改內容,谷歌僅僅隻是將這個功能預留用來應對緊急情況,所以這個 API 不會有什麼明顯的變更,開發者幾乎不需要重新進行適配。報錯更新問題:如上文所說出錯應該彈

2024-03-17

雀食挺麻煩……)與此同時,Devin還在根據實際情況不斷修改自己的後續計劃。一段時間過後,一個本地的聊天機器人程序就跑起來。測試一段時間後Mckay Wrigley認為,Devin已經可以算Agent的ChatGPT時刻。復現Devin計劃ingDevin這邊大夥

2022-06-30

和黑客馬拉松在內的活動。它還允許成員使用 CodeSee 查看修改的影響,以創建代碼庫的可視化,從而可以輕松地引導其他技術人員和非技術人員完成更改。

2023-04-03

網上使用ChatGPT。看起來,三星這次又搞個大新聞啊。有網友將此戲稱為:xx網盤存公司內部文件(doge)。不過,也有網友發現這件事詭異的地方。他們是怎麼知道數據被泄露的?ChatGPT這麼快就發佈新版本嗎?而當《經濟學人》

2022-09-01

開發人員JeffJohnson在一篇博客文章中指出,Google在Chrome104中意外引入一個bug。由於一個權限設置失誤,導致網站無需獲準用戶許可、即可將相關內容寫入系統剪貼板。雖然Safari和Firefox也有類似的功能,但至少Apple和Mozilla有設置相

2023-05-11

的路要走。除PALM 2,Google還宣佈正在訓練的全新基礎模型Gemini。這是第一個多模態模型,同樣包含參數大小不同的模型。除介紹模型,Google還特地介紹開發 AI 技術的社會責任感,包括兩個判別AI生成內容的工具:- watermarking(嵌