X一小夥分享,為測試Gemini1.5Pro,自己在編寫一個網頁的代碼時故意留3個bug,並分別錄制網頁bug視頻。接著把代碼庫打包成文件連同視頻一起輸給Gemini1.5Pro,提示它找到並修復代碼中的所有bug,且要提供一個簡要指南以及所做更改的說明。
沒想到,Gemini 1.5 Pro還真就分分鐘正確識別並修復每一個bug。
小夥將這種玩法po出來後熱度不斷攀升,網友們紛紛一鍵三連,轉贊收藏量過萬。
其本人還在評論區強調,“這隻是一個簡單的例子,也將是它最差的表現”,Gemini這小汁前途不可限量啊。
有網友表示想起來一件事覺得有趣:英偉達黃院士前段時間曾公開表示“孩子們以後不需要學編程”,那時候還有很多人反對稱“AI不會取代程序員”
。
但甭管怎麼說,AI可以給程序員提供幫助是有目共睹的。
接下來我們展開來看Gemini 1.5 Pro修復bug的經過。
事件經過
正如開頭提到的,網友先是在編寫網頁代碼時故意寫錯3處:
這就導致網頁上的一些功能操作無法正常運行,於是小夥分別拍攝3處無法正常運行的視頻,每個視頻十幾秒。
然後將視頻連同代碼庫一起輸給Gemini 1.5 Pro。
prompt為:
Fix the bugs in my code.Create a simple markdown guide for me to fix them,and then write the actual code to fix the bugs.I need the full code like it’s for a complete PR so I am make the changes.(修復我代碼中的bug,為我創建一個簡單的Markdown指南以修復bug,然後編寫實際的代碼來修復。我需要完整的代碼,就像它是為一個完整的Pull Request一樣,這樣我才能進行更改。)
隨後,Gemini 1.5 Pro立刻準確識別3個bug:
點擊一個待辦事項並不會將其標記為完成/未完成
主題切換器不會切換主題
點擊登錄按鈕不會觸發任何操作
緊接著就分別給出修復方案,附帶代碼:
小夥仔細對照自己敲的代碼,確認Gemini 1.5 Pro給出的答案是正確的:
小夥還強調,這3個bug在代碼庫文件中其實離著很遠,這也就意味著Gemini 1.5 Pro確實讀完完整的上下文。
“想要訪問權限”
網友看到這一系列操作後激動搓手,直呼想要Gemini 1.5 Pro訪問權限:
除坐等外,還有網友表示用GPT-4幫忙修復代碼也很好使,順帶暢想一下GPT-5:
接下來可能是實時交互?或許能與GPT-5進行屏幕共享?
而另一邊已經獲得訪問權限的網友早就玩嗨。
比如,一次性輸給Gemini 1.5 Pro最新的10篇論文,讓它從中找到一個作者的電子郵件地址。
結果Gemini 1.5 Pro第一次就成功找到:
然後又讓Gemini 1.5 Pro從超360000token的《哈利·波特與鳳凰社》整本書中找到一句話的說話人,Gemini 1.5 Pro也成功找到。
測試繼續上難度,一次性輸入三本書,Gemini 1.5 Pro最後用時約1分鐘再次成功找到對應的說話人:
驚訝之餘,這位測試者總結Gemini 1.5 Pro的邏輯推理能力:
對於常規提示,接近GPT-4的性能。
但當我添加數十個例子時,Gemini的性能在提升,似乎沒有上限。多示例提示成為新的微調方法。
沃頓商學院教授Ethan Mollick也來整活。輸給Gemini 1.5 Pro一本352頁的《太空60年》規則手冊,約250000token,然後要求它扮演一個角色。
即使說明書分散在很多頁上,而且非常復雜,但Gemini“似乎明白”:
Ethan Mollick教授表示,對所有其他AI進行這項測試都是失敗的,隻有Gemini 1.5 Pro成功。
這位網友想要編譯整個X算法的代碼存儲庫並將其上傳到Gemini 1.5 Pro,正在線向網友征集想問的問題。
隻見編譯完成後,共310489token,Dogan Ural向Gemini 1.5 Pro提出網友們關心的一系列問題,比如“在Twitter上擴大或者減少影響力的前5件事是什麼?”
Gemini 1.5 Pro很輕松地給出這樣嬸兒的答案:
你還見過哪些有趣的玩法?歡迎評論區分享~