4月28日消息,Sora爆火後,掀起全球競逐AI視頻生成的熱潮。近日,國內一支AI生成的視頻短片引發關註。該視頻來自生數科技聯合清華大學最新發佈的視頻大模型Vidu。
根據官方介紹,該模型采用團隊原創的Diffusion與Transformer融合的架構U-ViT,支持一鍵生成長達16秒、分辨率高達1080P的高清視頻內容。
比如,輸入“畫室裡的一艘船駛向鏡頭”這樣一句簡單的指令,Vidu就可以生成效果逼真、鏡頭連貫的一段視頻。視頻的整體質感可以與Sora相媲美。
除可以生成復雜、細節豐富的場景,Vidu還可以虛構場景以及想象超現實主義的畫面,具有多鏡頭語言,更好地理解生成熊貓、龍等富有中國文化特色的形象等。
據證券時報報道,基於在機器學習和多模態大模型的長期積累,生數科技團隊在兩個月時間裡突破長視頻表示與處理的多項關鍵技術,成功研發推出Vidu視頻大模型。
公開資料顯示,生數科技成立於2023年3月,核心團隊來自清華大學人工智能研究院,此外還包括來自北京大學和阿裡巴巴、騰訊、字節跳動等科技公司的多位技術人才。截至2024年3月,生數科技員工總數超70人,其中近90%為研發人員。
生數科技由清華系AI公司瑞萊智慧RealAI、螞蟻集團和百度發起的BV百度風投聯合孵化創立,致力於打造可控多模態通用大模型。去年3月,生數科技開源全球首個基於U-ViT框架的多模態擴散大模型UniDiffuser。
去年6月,生數科技獲得螞蟻集團、BV百度風投、卓源資本的近億元天使輪融資;8月,完成數千萬元天使 輪融資,本輪融資由錦秋基金獨傢投資。
2024年3月,生數科技完成新一輪數億元融資,由啟明創投領投,達泰資本、鴻福厚德、智譜AI、老股東BV百度風投和卓源亞洲繼續跟投。
證券時報報道稱,在三輪融資總計數億元人民幣的資本加持下,生數科技已成為目前國內多模態大模型中估值最高的初創公司之一。(周小白)