國際頂尖水平!首個Sora級國產自研視頻大模型Vidu發佈


快科技4月28日消息,在2024中關村論壇年會未來人工智能先鋒論壇上,生數科技聯合清華大學發佈中國首個長時長、高一致性、高動態性視頻大模型Vidu。

這也是自Sora發佈之後全球率先取得重大突破的視頻大模型,性能全面對標國際頂尖水平,還在加速迭代提升中。

據解,該模型采用團隊原創的Diffusion與Transformer融合的架構U-ViT,支持一鍵生成長達16秒、分辨率高達1080P的高清視頻內容。

除在時長方面突破,Vidu在視頻效果方面也實現顯著提升,主要包括:

能夠生成細節復雜的場景,且符合真實的物理規律;

能夠生成真實世界不存在的虛構畫面,創造出具有深度和復雜性的超現實主義內容;

能夠生成復雜的動態鏡頭,不再局限於簡單的推、拉、移等固定鏡頭,而是能夠圍繞統一主體在一段畫面裡就實現遠景、近景、中景、特寫等不同鏡頭的切換;

在16秒的時長上保持連貫流暢,隨著鏡頭的移動,人物和場景在時間、空間中能夠保持一致;

能夠生成特有的中國元素,例如熊貓、龍等。


相關推薦

2024-04-28

造可控多模態通用大模型。去年3月,生數科技開源全球首個基於U-ViT框架的多模態擴散大模型UniDiffuser。去年6月,生數科技獲得螞蟻集團、BV百度風投、卓源資本的近億元天使輪融資;8月,完成數千萬元天使 輪融資,本輪融資

2024-04-30

友熟知的 Pika 、 Runway 那幾個 Sora 競品,而是初出茅廬的國產視頻大模型 Vidu 。咱看到的那些視頻,就是前幾天, Vidu 在中關村論壇的人工智能主題日上公佈的。它最長能生成16 秒,一句 “ 木頭玩具船在地毯上航行 ” 的提示詞

2024-06-13

佳視界科技有限公司聯合清華大學自動化系正式發佈我國首個超長時長、高性價比的Sora級視頻生成大模型視界一粟 YiSu”。該大模型擁有模型原生的16秒超長時長,並可生成至1分鐘以上視頻。據介紹,YiSu模型成本更低、速度更

2024-02-16

,Sora都展示出令人期待的落地前景。為全方位展示Sora的水平,OpenAI一口氣放出48個用Sora直接生成、未經修改、長度不等(9秒~60秒)的視頻。下文附有48個視頻的完整展示,火眼金睛的讀者朋友們可以研究下這些視頻的準確程度

2024-03-18

無人駕駛“空中的士”,已經來到現實生活。今日,全球首個獲得適航認證的國產自研“空中的士”億航EH216-S在淘寶上架,標價239萬元。測試飛行據解,該“空中地市”為全智能無人駕駛航空器,可搭載兩人,能夠全智能低空

2022-08-16

ew階段構建全新的V23倉庫,未來將逐步向Debian、Arch Linux等國際頂級的主流發行版看齊。deepin將打造中國主導、具有國際影響力的桌面操作系統根社區藍圖,使產品體驗與底層安全更加自主可信。此外,還新增V23桌面壁紙、HWE 5.18

2024-02-26

自主創新方面面臨更大的挑戰。因此國內企業傾向於跟隨國際領先者已驗證的技術路線,這種策略相對更為穩健且高效,可以快速縮短技術差距。對齊國外大模型成本太高國內應用場景是機會不少業內人士認為,在底層基礎技術

2024-02-16

生的事件,例如遵循特定的相機軌跡。即便如此,OpenAI的首個視頻模型發佈後,不少網友驚呼:不少人要丟工作”、整個素材行業可能都會因此衰落”、語言大模型後,OpenAI又要一次加快AI進化”。目前已有一些視覺藝術傢、設

2022-08-30

本,到手價999元起。作為該機一大亮點,中興遠航30S搭載國產自研5G芯片紫光展銳T760,基於6nmEUV工藝,采用A76*4+A55*4核心架構、Mail-G57GPU,AI算力達2.4TOPS,支持4K30fps視頻編碼,4K30fps10位視頻解碼。得益於此,中興遠航30S支持5G全

2024-03-18

全球首個開源的類Sora架構視頻生成模型,來!整個訓練流程,包括數據處理、所有訓練細節和模型權重,全部開放。這就是剛剛發佈的Open-Sora1.0。它帶來的實際效果如下,能生成繁華都市夜景中的車水馬龍。還能用航拍視角,

2024-02-23

自稱是“清華博士”的大V,其推出的199元AI課程,已在短視頻平臺上吸引到上百萬的粉絲。有數據顯示,李一舟售賣的AI課名為《每個人的人工智能課》,一年內賣出約25萬套,銷售額約5000萬。此消息一出就登上熱搜,網友的評

2023-12-06

,確實向華為供貨可信計算芯片,公司的可信計算芯片是國際可信計算產業中,首個加載中國密碼算法和國際密碼算法的雙算法可信計算核心產品,單芯片同時支持國內/國際可信計算標準協議。就目前而言,華為的商用筆記本

2024-02-18

所欲地制作短視頻。可以制作不同分辨率的豎版、方形和水平視頻。而且計算量越高,視頻質量也會越高。AI科學傢、創業者賈佳亞在社交媒體上表示:Sora基於視頻的三維結構分解壓縮,用不同分辨率,不同時長,不同場景的各

2024-02-19

wItAll一條主題為‘OpenAI的重磅炸彈證實特斯拉的理論’的視頻下留言,稱‘特斯拉已經能夠用精確物理原理制作真實世界視頻大約一年’。 隨後他在 X 上轉發一條 2023 年的視頻,內容是特斯拉自動駕駛總監 Ashok Elluswamy 向外界介