可靈1.6模型發佈:文本響應度、運動合理性明顯提升


快科技12月20日消息,近日快手可靈AI宣佈基座模型再升級,視頻生成推出可靈1.6模型

據快手官方介紹,1.6模型在文本響應度、畫面美感及運動合理性上均有明顯提升,畫面更穩定更生動,對運動、時序類動作、運鏡等文字描述響應更好。

並且動態質量進一步增強,運動更加合理,人物表情更自然;同時1.6模型畫面質量也再次進化,色彩、光影、細節表現均明顯提升,提供支持標準和高品質模式,圖生視頻效果提升同樣顯著。

此前在今年9月份,可靈AI 1.5模型上線,當時就已經支持高品質模式,與可靈1.0模型隻能生成最高720P的視頻不同,可靈1.5模型則支持生成1080P高清視頻。

同時新模型所生成的畫面構圖更加美觀、視頻清晰度大幅提升,並且動態質量也顯著提升,主要加強部分運動的合理性。

數據顯示,自今年6月6日發佈以來,可靈AI已進行數次迭代和升級,目前已擁有超過600萬用戶,累計生成超6500萬個視頻和超1.75億張圖片。

在8月底舉行的2024快手光合創作者大會”上,快手高級副總裁、主站業務與社區科學線負責人蓋坤表示,AI正不斷深入快手的業務生態與用戶的內容生產環節中。


相關推薦

2024-03-06

AI界的“炸圈”新聞,當屬OpenAI勁敵Anthropic推出Claude3系列模型,真正做到與GPT-4全面掰手腕。要知道,從OpenAI去年3月發佈“最強大模型”GPT-4到今天,整整一年來,這是第一款真正挑戰到其天花板地位的模型,不僅評測成績通通

2023-03-15

我們並沒有等太久。今天凌晨,OpenAI發佈多模態預訓練大模型GPT-4。GPT-4 實現以下幾個方面的飛躍式提升:強大的識圖能力;文字輸入限制提升至 2.5 萬字;回答準確性顯著提高;能夠生成歌詞、創意文本,實現風格變化。“GPT-4

2023-03-16

相當於3072個英文單詞,一旦對話的長度超過這個限制,模型就會生成不連貫且無意義的內容。然而,到GPT-4,最大token數為32768個,大約相當於24576個單詞,文本長度被擴大八倍。也就是說,GPT-4現在可以回答更長的文本。OpenAI在

2024-09-29

兒,還有一個抖音眼熟的名字—快手。老對手,新領域,可靈AI的影響力正在被加速釋放,在這一點上,字節如坐針氈,畢竟強如Sora,仍是外敵,而快手AI,早已殺到城下。追逐使命還是修築護城河,囊外還是安內,答案藏在視

2024-04-09

hatGPT每天需要消耗掉1.7萬個美國傢庭一天的用電量。由於模型參數、能耗處理等因素差異,不同AI模型的耗電量無法被準確估算。於是,亞裡克斯以英偉達推出的A100服務器作為測算對象,對整個人工智能行業可能產生的耗電量進

2024-04-12

12日,OpenAI在社交媒體平臺發文表示:“我們新的GPT-4Turbo模型現在可供付費ChatGPT用戶使用。我們提高該模型寫作、數學、邏輯推理和編碼的能力。”作為GPT-4的升級版,GPT-4Turbo在文本生成質量與準確性方面,代碼生成的能力和

2022-10-08

表示:我已經有點適應不AI的進化速度……文本圖像生成模型超進化版你可能會覺得Make-A-Video是個視頻版的DALL·E。實際上,差不多就是這麼回事兒前面提到,Make-A-Video是文本圖像生成(T2I)模型的超進化,那是因為這個AI工作的

2024-05-16

快科技5月15日消息,今日,百度發佈公告表示,文心大模型日均處理Tokens文本已達2490億。百度認為,使用大模型不應該隻看價格,更要看綜合效果,隻有讓AI應用效果更好、響應速度更快、分發渠道更廣,才能讓人們切實感受AI

2024-11-15

尋求將這些技術轉化為實際的產品和服務。舉個例子,「可靈」作為快手押註的核心產品,在PC端爆火之後,一直在籌備移動端,據矽星人解,快手正在密集招聘產品經理,目前可靈App負責人曾在騰訊任職。這需要既理解技術又

2023-03-15

草圖就能做出同款網頁。當國內還在熱議人工智能對話大模型產品ChatGPT時,背後核心預訓練模型技術GPT卻突然重磅升級。北京時間3月15日凌晨,創造出ChatGPT的美國 AI 公司OpenAI 正式對外發佈GPT-4。據悉,GPT-4是新一代多模態大模

2024-04-17

17日消息,中國電信近期宣佈開源其12B參數規模的巨型AI模型TeleChat-12B,此舉標志著國內大模型技術發展的又一重要進展。與1月份發佈的7B參數版本相比,TeleChat-12B在內容理解、性能表現和應用場景等方面實現約30%的整體提升,

2024-12-18

的一個,尚未成為頭部,行業影響力甚至不及快手旗下的可靈,也不足以跟Sora相較量。當我們在談論字節的下一個抖音,不論是豆包還是即夢,都是基於已知進行推測分析。有沒有一種可能,AI時代的超級應用還處於未知?(應

2024-02-27

更令人印象深刻的是,還能在關鍵基準上越級碾壓更大的模型,比如Llama213B。與此同時,谷歌還放出16頁的技術報告。谷歌表示,Gemma這個名字源自拉丁語「gemma」,也就是「寶石」的意思,似乎是在象征著它的珍貴性。歷史上,

2024-05-14

之傢(ChinaZ.com) 5月14日 消息:OpenAI於2024年5月13日推出GPT-4o模型,其中的“O”代表全能(Omni),在人機互動的自然度上取得顯著進步。GPT-4o支持多模態輸入和輸出,包括語音、視頻、圖像和代碼,能夠實時與用戶進行無縫交流,理