國產Sora來!清華發佈視頻生成大模型“視界一粟YiSu”


快科技6月12日消息,據媒體報道,北京極佳視界科技有限公司聯合清華大學自動化系正式發佈我國首個超長時長、高性價比Sora級視頻生成大模型視界一粟 YiSu”。

該大模型擁有模型原生的16秒超長時長,並可生成至1分鐘以上視頻。據介紹,YiSu模型成本更低、速度更快、端側可用。

年初Sora的爆火,讓DiT架構受到業內極大的關註,很多公司和項目也開始復現DiT路線。

而視界一粟YiSu”則是基於團隊自研的視頻生成大模型技術,並沒有止步於DiT。該團隊融合LLM和擴散模型的自研架構,結合各種路線的優勢,在多模態融合、訓練效率、推理效率、模型效果等方面達到優化,打造視頻生成的方案。

此前,該團隊曾提出WorldDreamer,是全球第一次以Transformer和LLM(Masked Token路線)為中心的視頻生成工作。

此次發佈的視頻生成大模型,是YiSu-Beta V0.5版本,YiSu大模型正在按照每周一個小版本、每月一個大版本的迭代速度成長進化。未來幾個月,在視頻時長、可控性、推理速度、運行成本、理解物理世界等方面還將持續迎來大幅度的提升。

據解,極佳科技核心團隊擁有超過十年的AI技術積累。其團隊來自清華大學、中科院、中科大等知名院校,累積發表AI頂級論文200餘篇,多次獲得全球權威AI比賽世界冠軍。


相關推薦

2024-04-28

4月28日消息,Sora爆火後,掀起全球競逐AI視頻生成的熱潮。近日,國內一支AI生成的視頻短片引發關註。該視頻來自生數科技聯合清華大學最新發佈的視頻大模型Vidu。根據官方介紹,該模型采用團隊原創的Diffusion與Transformer融合

2024-04-30

友熟知的 Pika 、 Runway 那幾個 Sora 競品,而是初出茅廬的國產視頻大模型 Vidu 。咱看到的那些視頻,就是前幾天, Vidu 在中關村論壇的人工智能主題日上公佈的。它最長能生成16 秒,一句 “ 木頭玩具船在地毯上航行 ” 的提示詞

2024-04-28

快科技4月28日消息,在2024中關村論壇年會未來人工智能先鋒論壇上,生數科技聯合清華大學發佈中國首個長時長、高一致性、高動態性視頻大模型Vidu。這也是自Sora發佈之後全球率先取得重大突破的視頻大模型,性能全面對標國

2024-09-29

啟邀測。距離Sora已經橫空出世已經超過7個月,這段時間國產視頻大模型的發佈此起彼伏,圍剿Sora在商業語境中似乎成為參與玩傢的共有使命。字節在七個月之後,才選擇正式蹚入這條沸騰之河,而此時在其面前,不止有Sora,

2024-02-22

的新晉大V。而他神秘的地方就在於,身上的諸多頭銜:清華博士、三傢公司的創始人、抖音百萬網紅……最為出圈的討論,就是這一次與OpenAI的創始人SamAltman“平起平坐”。也正是黑框眼鏡、流利的口條、199元的AI課以及高頻出

2024-02-21

快科技2月21日消息,日前,梅西個人官方微博發佈視頻,回應此前缺席中國香港行友誼賽事件。然而,有網友看後提出質疑,稱視頻清晰度低、沒有露出牙齒,懷疑視頻為AI生成。據國內媒體報道,專傢認為質疑者指出的面部反

2024-02-21

AI 巨頭”分別是 OpenAI 創始人薩姆·奧特曼和賣 AI 課程的清華博士李一舟。圖|OpenAI 創始人薩姆·奧特曼和賣 AI 課程的清華博士李一舟。從2020年元宇宙到2023年的AIGC,再到今年的Sora,總有賣課人利用新技術制造焦慮,最後變現

2024-02-23

收割的機會都要抓住。“李一舟們”被封,課程下架自稱清華博士的李一舟,最近推上風口浪尖。2月22日,李一舟用於售賣AI課程的微信小程序“一舟一課”由於違反《即時通信工具公眾信息服務發展管理暫行規定》暫停服務,

2024-02-16

2月16日凌晨,OpenAI再次扔出一枚深水炸彈,發佈首個文生視頻模型Sora。據介紹,Sora可以直接輸出長達60秒的視頻,並且包含高度細致的背景、復雜的多角度鏡頭,以及富有情感的多個角色。目前官網上已經更新48個視頻demo,在

2024-05-01

眾號 InfoQ(ID:infoqchina),作者:凌,授權站長之傢轉載發佈。1視頻生成模型“新王登基”,Sora 何以成為全球焦點?2023年以來,多模態視頻生成技術取得顯著的進展和突破,從 Runway 到 Pika 再到年末的 VideoPoet,視頻生成模型進

2024-02-20

2月15日,OpenAI發佈視頻生成模型Sora,用戶可以通過文字提示得到長達1分鐘的高質量視頻,令市場大吃一驚。這款工具打破現有AI視頻生成領域的限制,無論是在生成時長上還是視頻分辨率上都遠遠超出同類玩傢。這也讓OpenAI坐

2024-02-26

ora,已經成為人工智能界的開年“王炸”。2月16日,OpenAI發佈Sora大模型,僅需通過文本即可自動生成視頻,這也是繼文本模型ChatGPT和圖片模型Dall-E之後,又一極具顛覆性的大模型產品。文本生成視頻並非始於Sora。據不完全統計

2024-02-23

書籍在售。李一舟,何許人也?公開資料顯示,李一舟,清華美院工業設計和設計創新方法專業、設計戰略與原型創新研究所博士。本科與碩士時期均就讀於湖南大學設計藝術學院。圖源:湖南大學設計藝術學院網站截圖在李一

2024-02-18

次創造歷史。這個堪稱“世界模型”的技術報告也在今天發佈,不過依然沒有公開具體訓練細節。昨天白天,“現實不存在”開始全網刷屏。“我們這麼快就步入下一個時代?Sora簡直太炸裂”。“這就是電影制作的未來”!Googl