華人團隊迷你GPT-4搶跑看圖聊天:OpenAI有的它都有 服務器已被擠爆


看美食圖寫菜譜,手繪網頁變代碼。GPT-4識圖功能遲遲不開放,終於有人忍不住自己動手做一個。MiniGPT-4來,Demo開放在線可玩。傳一張海鮮大餐照片上去,就能直接獲得菜譜。

傳一張商品效果圖,就可以讓AI寫一篇帶貨文案。
傳一張商品效果圖,就可以讓AI寫一篇帶貨文案。


手繪一個網頁,可以給出對應的HTML代碼:

除生產力拉滿,也支持根據常識推理圖上內容是否合理、解釋表情包為什麼好笑,以及看截圖找電影等娛樂玩法。
除生產力拉滿,也支持根據常識推理圖上內容是否合理、解釋表情包為什麼好笑,以及看截圖找電影等娛樂玩法。


可以說,GPT-4發佈時展示過的功能,MiniGPT-4基本也都有。

這下網友直接把Demo服務器擠爆,開發團隊連開4臺備用服務器,都有幾十人在排隊。


不等OpenAI,現在就能玩

除研究團隊給出的示例,網友也用MiniGPT-4玩出各種花樣

有人上傳自己畫的畫,讓AI評價評價。


有人上傳一張從車道拍攝的飛機墜毀瞬間,讓MiniGPT-4盡可能詳細地描述,並思考自動駕駛AI能不能理解這個場面。


做到這麼好的效果,MiniGPT-4實現起來卻並不復雜。

把圖像編碼器與開源語言模型Vicuna(小羊駝)整合起來,並且凍結兩者的大部分參數,隻需要訓練很少一部分。

傳統預訓練階段,使用4張A100在10個小時內就可完成,此時訓練出來的Vicuna已能夠理解圖像,但生成能力受到很大影響。

為解決這個問題,團隊讓MiniGPT-4與ChatGPT合作創建3500個圖像文本的高質量數據集,也一並開源。

用新的數據集微調可以顯著提高模型的生成可靠性和整體可用性,而且計算效率很高,使用單個A100隻需要7分鐘。


並且團隊正在準備一個更輕量級的版本,部署起來隻需要23GB顯存。

也就是消費級顯卡中擁有24GB顯存的3090或4090就可以本地運行。

MiniGPT-4開發團隊來自KAUST(沙特阿卜杜拉國王科技大學),包括4位華人成員和他們的導師 Mohamed Elhoseiny。


兩位正在讀博的共同一作還在GitHub頁面上特別標註正在找工作。有意向的公司要抓緊搶人~

在線Demo:https://minigpt-4.github.io

開源代碼:https://github.com/Vision-CAIR/MiniGPT-4

論文:https://github.com/Vision-CAIR/MiniGPT-4/blob/main/MiniGPT_4.pdf


相關推薦

2024-02-27

合作協議。也就是說,微軟不再獨寵OpenAI。同時推出在線聊天機器人平臺Le Chat,即使有微軟Azure算力資源,服務器還是被擠爆。由於其API比GPT-4最新版便宜20%,已經吸引部分創業者去嘗試。根據HyperWriteAI創始人測試,Mistral Large跑

2023-11-15

就在三個小時前,OpenAI的CEOSamAltma突然宣佈,ChatGPTPlus賬號暫停註冊,原因無他:訪問量激增超出服務器的承受能力。Altman在X上發文對此解釋道:由於OpenAI開發日後ChatGPT使用量的激增超出我們的承受能力,我們希望確保每個人都

2024-04-03

今早一睜眼就看到OpenAI公佈的又一 “ 重磅消息 ” :ChatGPT 現在不用登錄就能直接用。光看這標題,我以為原來大會員才能用的GPT-4,現在咱也能白嫖到。結果點進正文一看,原

2023-11-18

稱,然後全網比價,提供購買建議。此外,該GPTs還提供看圖“買同款”的功能。“用起來還真不錯。如果再加上 Amazon affiliate link (分享鏈接)感覺就能帶貨賺錢,” Quinn Leng在社交網站上表示。Choi Yong開發的“書籍創作者指南

2023-05-11

隨著語言模型的能力越來越強,現有的這些評估基準實在有點小兒科,有些任務的性能都甩人類一截。通用人工智能(AGI)的一個重要特點是模型具有處理人類水平任務的泛化能力,而依賴於人工數據集的傳統基準測試並不能準

2023-03-16

硬件資源采取配額供應的方式,限制其他內部AI工具開發團隊的使用量,從而確保基於GPT-4的新版必應聊天機器人和即將發佈的新款Office工具獲得足夠的資源。這種硬件短缺的現狀還對微軟的客戶產生影響:至少有一個客戶表示

2023-02-10

的影響。午間官方回應稱:看來是鵝的祝壽隊伍太龐大,服務器擠爆……現在已經恢復啦。官方也俏皮地表示,“看來是鵝的祝壽隊伍太龐大,服務器擠爆……現在已恢復啦,派對繼續。”QQ官方找到的全球第一個註冊QQ號的用

2023-03-20

預售模式。盡管還未公佈最終價格,活動發佈當天,南航服務器一度被擠到崩潰。頁面顯示,這款產品名為暢遊中國”,宣傳海報顯示,該產品不限年齡,可以在套餐內任選,5人拼團還可購買39代200代金券,代金券的有效期至202

2024-03-27

威性如何?Chatbot Arena(聊天機器人競技場),由伯克利團隊開發,每個模型在榜單上的得分,完全取決於真實人類用戶的使用體驗。我們來看一下打分規則:用戶同時向兩個匿名模型(比如ChatGPT、Claude、Llama)提出任何相同的

2022-07-02

。如今賣車竟然變得如此容易:不管誰傢上市一款新車,服務器都一定會被擠爆,銷量過萬似乎更是輕而易舉。一張張漂亮的預售訂單讓人不禁感慨:幾十萬的車就像不要錢一樣被“瘋搶”,難道中國汽車消費市場真的到瞭人均

2023-11-10

ChatGPT全線宕機“大崩潰”。北京時間昨夜今晨,AI聊天機器人產品ChatGPT和其API接口出現“嚴重停機”(MajorOutage)事件,整個故障時間陸陸續續長達超過12小時。據網絡狀況監測平臺Downdector顯示,北京時間今天上午9時40分左右,

2023-03-18

就公開所有貢獻者名單,機器之心整理一部分參與工作的華人學者。如果遺漏,歡迎補充。預訓練組Trevor CaiTrevor Cai 是 GPT-4 項目中吞吐量團隊的負責人。Trevor Cai 本碩畢業於南加州大學,2022 年 3 月加入 OpenAI。在加入 OpenAI 之前

2023-03-15

英語編寫的。為初步解 GPT-4 在其他語言上的能力,研究團隊使用 Azure Translate 將 MMLU 基準 —— 一套涵蓋 57 個主題的 14000 個多項選擇題 —— 翻譯成多種語言。在測試的 26 種語言的 24 種中,GPT-4 優於 GPT-3.5 和其他大 語言模型(

2024-05-12

勢,包括在全球超過20億臺在使用的設備,領先的半導體團隊等。它們能夠支持蘋果推廣AI產品,並支持包括面部識別在內需要大量芯片的AI任務。03一個月時間,蘋果能否扭轉局勢但在過去的十年裡,蘋果從未制定出一個全面的