Gemini修改bug讓網友大開眼界：錄網頁視頻把代碼庫甩給它就行

2024-03-09 來自量子位發表於業界精選

X一小夥分享，為測試Gemini1.5Pro，自己在編寫一個網頁的代碼時故意留3個bug，並分別錄制網頁bug視頻。接著把代碼庫打包成文件連同視頻一起輸給Gemini1.5Pro，提示它找到並修復代碼中的所有bug，且要提供一個簡要指南以及所做更改的說明。

沒想到，Gemini 1.5 Pro還真就分分鐘正確識別並修復每一個bug。

小夥將這種玩法po出來後熱度不斷攀升，網友們紛紛一鍵三連，轉贊收藏量過萬。

其本人還在評論區強調，“這隻是一個簡單的例子，也將是它最差的表現”，Gemini這小汁前途不可限量啊。

有網友表示想起來一件事覺得有趣：英偉達黃院士前段時間曾公開表示“孩子們以後不需要學編程”，那時候還有很多人反對稱“AI不會取代程序員”

。

但甭管怎麼說，AI可以給程序員提供幫助是有目共睹的。

接下來我們展開來看Gemini 1.5 Pro修復bug的經過。

事件經過

正如開頭提到的，網友先是在編寫網頁代碼時故意寫錯3處：

這就導致網頁上的一些功能操作無法正常運行，於是小夥分別拍攝3處無法正常運行的視頻，每個視頻十幾秒。

然後將視頻連同代碼庫一起輸給Gemini 1.5 Pro。

prompt為：

Fix the bugs in my code.Create a simple markdown guide for me to fix them,and then write the actual code to fix the bugs.I need the full code like it’s for a complete PR so I am make the changes.(修復我代碼中的bug，為我創建一個簡單的Markdown指南以修復bug，然後編寫實際的代碼來修復。我需要完整的代碼，就像它是為一個完整的Pull Request一樣，這樣我才能進行更改。)

隨後，Gemini 1.5 Pro立刻準確識別3個bug：

點擊一個待辦事項並不會將其標記為完成/未完成

主題切換器不會切換主題

點擊登錄按鈕不會觸發任何操作

緊接著就分別給出修復方案，附帶代碼：

小夥仔細對照自己敲的代碼，確認Gemini 1.5 Pro給出的答案是正確的：

小夥還強調，這3個bug在代碼庫文件中其實離著很遠，這也就意味著Gemini 1.5 Pro確實讀完完整的上下文。

“想要訪問權限”

網友看到這一系列操作後激動搓手，直呼想要Gemini 1.5 Pro訪問權限：

除坐等外，還有網友表示用GPT-4幫忙修復代碼也很好使，順帶暢想一下GPT-5：

接下來可能是實時交互？或許能與GPT-5進行屏幕共享？

而另一邊已經獲得訪問權限的網友早就玩嗨。

比如，一次性輸給Gemini 1.5 Pro最新的10篇論文，讓它從中找到一個作者的電子郵件地址。

結果Gemini 1.5 Pro第一次就成功找到：

然後又讓Gemini 1.5 Pro從超360000token的《哈利·波特與鳳凰社》整本書中找到一句話的說話人，Gemini 1.5 Pro也成功找到。

測試繼續上難度，一次性輸入三本書，Gemini 1.5 Pro最後用時約1分鐘再次成功找到對應的說話人：

驚訝之餘，這位測試者總結Gemini 1.5 Pro的邏輯推理能力：

對於常規提示，接近GPT-4的性能。

但當我添加數十個例子時，Gemini的性能在提升，似乎沒有上限。多示例提示成為新的微調方法。

沃頓商學院教授Ethan Mollick也來整活。輸給Gemini 1.5 Pro一本352頁的《太空60年》規則手冊，約250000token，然後要求它扮演一個角色。

即使說明書分散在很多頁上，而且非常復雜，但Gemini“似乎明白”：

Ethan Mollick教授表示，對所有其他AI進行這項測試都是失敗的，隻有Gemini 1.5 Pro成功。

這位網友想要編譯整個X算法的代碼存儲庫並將其上傳到Gemini 1.5 Pro，正在線向網友征集想問的問題。

隻見編譯完成後，共310489token，Dogan Ural向Gemini 1.5 Pro提出網友們關心的一系列問題，比如“在Twitter上擴大或者減少影響力的前5件事是什麼？”

Gemini 1.5 Pro很輕松地給出這樣嬸兒的答案：

你還見過哪些有趣的玩法？歡迎評論區分享～

相關推薦

谷歌Gemini 1.5上線多模態硬剛GPT-5 MoE首破100萬極限上下文紀錄

2024-02-16

剛剛，我們經歷LLM劃時代的一夜。Google又在深夜發炸彈，GeminiUltra發佈還沒幾天，Gemini1.5就來。卯足勁和OpenAI微軟一較高下的Google，開始進入高產模式。自傢最強的Gemini1.0Ultra才發佈沒幾天，Google又放大招。就在剛剛，GoogleDeepMind

南方潮濕到樹都長出氣生根：網友大開眼界

2024-06-30

6月29日消息，據國內多傢媒體報道，有網友發帖稱，西湖邊的柳樹上出現一個個紅色小芽。從照片可以看出，不光是柳樹的樹幹，地面裸露出來的根莖上也有。據悉，這是柳樹的氣生根，受濕潤空氣或高溫刺激，植物會長出氣生

Google全新大模型突然發佈：百萬上下文僅靠提示學會新語言

2024-02-18

Google下一代大模型，無預警降臨。Gemini1.5，除性能顯著增強，還在長上下文理解方面取得突破，甚至能僅靠提示詞學會一門訓練數據中沒有的新語言。此時距離去年12月Gemini1.0發佈，還不到3個月。現在僅僅中杯1.5 Pro版就能越級

GPT-4發佈：ChatGPT大升級太太太太強

2023-03-15

到解決辦法。在API方面，GPT-4還開放一個使用功能，允許修改“系統提示”。之前ChatGPT的回答總是冗長而平淡，這是因為系統提示中規定“你隻是一個語言模型……你的知識截止於2021年9月”。現在通過修改這句話，GPT-4就可以

Devin第一手使用體驗：完成度很高但要替代程序員還很遠

2024-03-17

哥把要求顯示的位置改為北美。總結小哥沒有給出 Devin 修改 Bug 的結果，隻是初步總結用 Devin 開發的第一個網站的使用體驗。先說優點：Devin 產品化做得很好，他給人的使用體驗是一個完整的產品而不是隻是一個簡單的對話框

GPT-4加強版Copilot上線動嘴就能用自然語言編程

2023-03-23

能：直接寫代碼解釋一段你看不懂的代碼理解報錯信息、修改bug甚至是進行單元測試……多姆克表示：有GPT-4加持的Copilot X，將讓AI能力存在於代碼生命周期的每一步，從根本上影響開發人員的體驗。這究竟是程序員的福音還是

大開眼界！湖南一高職老師用挖掘機做燒烤：嘗過後別有風味

2023-04-28

生們表示，這挖機做出來的燒烤別有一番風味。留言區，網友紛紛評論：泰酷辣挖機還能這麼用，饞饞就不能給我吃一串嗎

這個猛砸廣告的免費工具沒想到如此好用

2024-03-28

成一個國產大模型的名字，還在我的首頁刷屏……像B站網頁端，我滑下來10&nbsp;個廣告有9個都是它，而且這個情況持續很多天。因為 Kimi 用著不賴，加上免費，最近還挺火的，甚至服務器都已經跟不上用。其實世超用它已

新代碼庫顯示Android 15將可以更好地處理WebView崩潰問題

2024-03-04

值得註意的是谷歌並不準備在常規情況下使用 WebView API 修改內容，谷歌僅僅隻是將這個功能預留用來應對緊急情況，所以這個 API 不會有什麼明顯的變更，開發者幾乎不需要重新進行適配。報錯更新問題：如上文所說出錯應該彈

AI程序員Devin臥底工作群修bug 還和CTO聊技術

2024-03-17

雀食挺麻煩……）與此同時，Devin還在根據實際情況不斷修改自己的後續計劃。一段時間過後，一個本地的聊天機器人程序就跑起來。測試一段時間後Mckay Wrigley認為，Devin已經可以算Agent的ChatGPT時刻。復現Devin計劃ingDevin這邊大夥

CodeSee推出Open Source Hub在線社區

2022-06-30

和黑客馬拉松在內的活動。它還允許成員使用 CodeSee 查看修改的影響，以創建代碼庫的可視化，從而可以輕松地引導其他技術人員和非技術人員完成更改。

三星被曝因ChatGPT泄露芯片機密韓媒驚呼數據“原封不動”直傳美國

2023-04-03

網上使用ChatGPT。看起來，三星這次又搞個大新聞啊。有網友將此戲稱為：xx網盤存公司內部文件（doge）。不過，也有網友發現這件事詭異的地方。他們是怎麼知道數據被泄露的？ChatGPT這麼快就發佈新版本嗎？而當《經濟學人》

Chrome 104權限設置bug讓網站無需詢問即可寫入內容到剪貼板

2022-09-01

開發人員JeffJohnson在一篇博客文章中指出，Google在Chrome104中意外引入一個bug。由於一個權限設置失誤，導致網站無需獲準用戶許可、即可將相關內容寫入系統剪貼板。雖然Safari和Firefox也有類似的功能，但至少Apple和Mozilla有設置相

谷歌一雪前恥全新PaLM 2反超GPT-4 Bard史詩進化

2023-05-11

的路要走。除PALM 2，Google還宣佈正在訓練的全新基礎模型Gemini。這是第一個多模態模型，同樣包含參數大小不同的模型。除介紹模型，Google還特地介紹開發 AI 技術的社會責任感，包括兩個判別AI生成內容的工具：- watermarking（嵌

熱門推薦