號稱業界最高水平!Mate公佈文生圖模型CM3Leon


快科技7月16日消息,近日,Meta宣佈,將開發一款名為CM3Leon的AI模型,該模型能夠根據文本內容生成圖片,也可以為圖片生成文本描述。

Meta方面表示,CM3Leon在文生圖方面的表現,達到業界最高水平。

這意味著,該模型的表現將超越谷歌、微軟等廠商的一眾產品。

目前,Meta已經演示CM3Leon的表現,展現該模型在包括復雜的文本提示生成圖片、根據文本指令編輯圖像等方面的表現。

據悉,為訓練該模型,Meta使用數百萬張來自Shutterstock的授權圖片,有著高達70億個參數,這是OpenAI的EALL-E2模型的兩倍以上。

不過,Meta也承認,現階段的CM3Leon模型可能存在數據偏見的問題,仍然需要行業監管。

CM3Leon是一款基於Transformer神經網絡結構的模型,該神經網絡的特性是利用註意力機制來處理輸入數據。

這一特點使得相較基於Transformer神經網絡的模型,相較基於diffusion的模型具有更高的訓練效率,且計算成本更低。


相關推薦

2023-06-13

ChatGPT,360周鴻禕認為國內的技術已經基本趕上國際平均水平。在在6月13日的360智腦大模型應用發佈會上,三六零集團創始人周鴻禕表示:國內現在(AI大模型)你追我趕,不斷地相互激勵,縮小和全球領先技術的距離。原來我說

2024-02-24

業界,它是Google“最大、最有能力和最通用”的AI系統,號稱第一個原生多模態大模型,能力超越GPT-4,也被認為是Google反擊微軟和OpenAI的強大工具。對此,在 2 月 8 日,Google還把自傢對標 ChatGPT 的服務 Bard 更名為 Gemini,以著重

2023-03-31

一言屬於哪種技術還不清楚。第三,算力上的差距。OpenAI號稱自己的模型是千億規模參數,也就是每次計算的時候擁有1000張以上顯卡分佈式計算的算力。百度與國外幾傢主要科技企業的算力差距同樣不小。當然,百度和Midjourney

2023-04-16

項危險的技術。就在幾周前,他還和人工智能研究界和產業界的大佬們一起簽署一篇公開信,呼籲全球所有實驗室暫停比GPT-4更強的AI模型研發,暫停時間至少為6個月。(鞭牛士整理自澎湃、36kr、第一財經、每日經濟新聞等)

2024-01-06

逼企業完成數字化、智能化轉型。在周鴻禕看來,美國產業界已經All in AI。目前最成功的AI創新是那些用大模型重塑產品和業務流程的公司,比如微軟。”此前,周鴻禕預判2024年大模型發展時,認為大模型不會被壟斷,不會像操

2024-02-18

型Gemini 1.5 Pro,在與OpenAI的大模型之戰中加速超越。這是業界迄今最強的大語言模型,最高可支持10,000K Token上下文,直接將性能提升到百萬級別,在性能上完全秒殺OpenAI的GPT-4 Turbo。百萬級別Token意味著什麼?GoogleAI項目負責人

2024-01-06

快科技1月6日消息,昨晚舉辦的2023年風馬牛年終秀”上,360創始人周鴻禕分享自己關於2024大模型的十大趨勢判斷。周鴻禕表示:大模型將成為數字系統標配,就像當年的PC一樣,無處不在。而且2024年開源大模型將爆發,讓大模

2024-01-07

,周鴻禕現場還與國外同行分享交流心得,他認為美國產業界已經All in AI,通過AI創新尋找增量市場。他建議企業將含AI量”作為業務考核指標,比如業務部門在AI上的資源投入、人才濃度、產品轉化效率、員工對AI開源項目、AI

2024-05-31

各個中短視頻平臺都有自己的剪輯工具,但剪映的使用率最高。最後一次公開數據顯示,2021年剪映月活為1億。與TikTok相匹配的CapCut,上線近4年,調研機構data.ai的報告顯示,2023年1月,這款產品的月活超過2億,一度超越Instagram

2024-04-08

,我們這次找來當下最熱門的五款大模型,並且開通付費最高等級的模型,模擬工作生活中的場景進行一次“非專業性測試”,看看哪一款是現階段我們用著稱心的“AI好幫手”!參與評測的大模型有:大模型老大ChatGPT4、Google

2024-02-20

及一句口號:“給自己一個機會”。無獨有偶,甚至有人號稱手上有北美NASA工作人員的資源,已經拿到接口,把Sora打包到GPTs,做成軟件發佈上線。除此之外,還有搜集各類Sora文章、專有名詞等資料,做成飛書文檔賣錢的,也

2022-09-02

餘承東提到Mate 50這次在通信技術上會帶來新突破,並且號稱要向上捅破天。這個新技術具體是什麼,華為沒有公佈,要到發佈會上才會揭曉,但業界分析認為跟衛星通信功能有關,跟華為所說的向上捅破天也非常契合。此前郭

2024-02-16

噪聲塊來實現這一點。該模型可以生成可變大小的圖像,最高可達2048 × 2048分辨率。4、新興的仿真能力:OpenAI發現視頻模型在大規模訓練時表現出許多有趣的突發能力。這些功能使Sora能夠從現實世界中模擬人、動物和環境的某

2024-05-21

擴展並行能力,實現更快的推理性能和更低成本,相較於業界主流框架,其推理速度提高1.3倍。競速大模型商業化雲廠商亮劍觀察下來,阿裡、騰訊、字節的商業化路徑基本趨同,即“迭代通用模型的能力+構建完整的生態+研發