在商湯2024年年會上,湯曉鷗數字人現身,來一場跨越時空的重逢。按照以往習慣,每年湯老師都會說上一段脫口秀,已經成為商湯年會保留節目。熟悉湯老師演講都知道,他是被人工智能事業耽誤的“脫口秀大師”,如今以數字人的形象,再度用幽默的方式與我們相見。
除被他的幽默感染,不少人還被逼真的效果所驚艷,堪稱“年會最佳彩蛋”。
並由此引發大傢對湯教授的懷念。
湯曉鷗數字人現身商湯年會
不講企業經營,也不講公司管理。還是老規矩,嘮兩句嗑。
每年湯曉鷗演講的開場都是“我們先來復習一下去年的演講”,今年數字人也不例外。
按照商湯CEO徐立的話說,這是特有的湯氏套娃演講風格。
復習之前,他被cue到“彈鋼琴”,結果他說:今年沒接到通知啊。
到正兒八經的復習環節,結果已經有人會搶答。(Doge)
首先他說道:自己的推薦是有一點前瞻性的。嗯,確實是這樣的。
比如《波西米亞狂想曲》第二年就斬獲奧斯卡;還有“人類文明的起點是一根愈合的大腿骨”結果被引用到《流浪地球2》中李雪健老師拯救地球去;最後還是聊到他多次提及的“大兄弟”——宮崎駿,重出江湖拍部《蒼鷺與少年》……
他感嘆像宮崎駿這樣的大師創作並不容易,“人生中最重要的事就是很麻煩的”,對此他也深有體會。
比如徐立每次深夜找他要聊聊的時候,他都有這樣的感覺。對此他的解決方案是:
既然解決不麻煩的問題,那就要解決麻煩的人。所以索性不接他的電話。
後來麻煩的人越來越多,他就直接選擇關機。
之後,他提及最近上映的《熱辣滾燙》、東北取材電視劇《漫長的季節》,並借著《漫長的季節》結尾橋段“火車在天地裡往前開”,談到商湯也坐著新洲樓下小火車,在AI這條路上往前開。
你看要不說咱們有前瞻性呢,小火車在2021年就備好,就等著《漫長的季節》火一把呢。
談到今年春晚最幽默的新疆人小尼,他作為東北人不服氣,於是推薦一部小品《吃面條》。並介紹這背後的花絮,正是因為編導最後開播前確定讓演員上場,才有春節第一部小品。
借此就來到他以往多次提及“原創”這件事。不得不說,這很湯式風格。
堅持原創這件事,是留給有勇氣的人做的;而真正支持創新的人,是有勇氣擔責的。
也因為這樣的堅持,才有喜劇事業蓬勃發展,才有很多優秀的喜劇工作者。
趙本山、趙麗蓉、馮鞏和我。
(傳下去,這是四大喜劇天王)
最後他談到以前的喜劇之所以那麼好看,是因為時間的沉淀才成為經典。也許前路一片迷霧,而他們隻是一群選擇出發,並堅信趕路的人。
還是一樣的引經據典,還是一樣的湯式風格,這樣一段不足十分鐘的數字人演講已經讓人感懷。
AI的高級意義。
動容的同時,也著實被技術細節驚艷到。比如中場湯老師還喝一次水。
效果這麼逆天嗎?其他傢都是正臉,這個低頭和手部動作都挺自然的。
打破次元的如影數字人技術
真實世界的湯曉鷗老師已經與我們告別。這一次特殊演講的開篇,就提到讓湯老師“跨越次元”的,是商湯如影數字人技術。
最早在去年四月,商湯發佈“日日新”大模型體系,如影(SenseAvatar)首次亮相。
據解,僅需要5分鐘真人視頻素材,如影就可以生成出動作聲音自然、口型準確、多語種精通的數字人分身。
3個月後,商湯“日日新”大模型體系全面升級,如影也進化到2.0版本。
語言方面,如影2.0打造的數字人將英語、日語、西班牙、阿拉伯語等多語種的精準度提升30%以上,而且口型和語音匹配得更加自然。
生成效果方面,如影2.0支持實現影級4K高清視頻的輸出,成片質感再度提升。
同時也帶來新玩法,用戶可通過輸入提示詞自動生成與描述匹配的專屬數字人形象,還是可以實現數字人歌唱功能的那種。
當湯曉鷗數字人現身為大傢表演脫口秀的那一刻,其自然逼真的表現效果讓不少網友為之震驚,直呼這就是《流浪地球2》照進現實。
這一場景,就如電影中,科學傢圖恒宇通過量子計算機“復活”其因車禍去世的女兒:
其實,類似案例如今正在更為頻繁地照進現實。
比如,音樂人包小柏同樣依靠AI技術,“復活”女兒。
2021年包小柏的女兒因罕見疾病去世,年僅22歲。經歷失去愛女的悲痛後,包小柏決心攻讀博士開始鉆研AI技術,期望能在虛擬世界中保存女兒的存在。
經過反復探索,包小柏如願復刻出“數字女兒”,在包小柏妻子生日當天,“女兒”還為媽媽唱一首生日歌,為這個傢庭帶來些許慰藉。
B站up主吳伍六,前段時間用AI工具生成奶奶的虛擬數字人,也引起不小關註。
隻見視頻中,數字人“奶奶”講著流利的湖北的方言與up主對話。
如奶奶生前一樣,囑托其父親“別喝酒,要節約,別打牌”:
事實上,自生成式AI技術興起以來,一直有人在探索用AI“復活”親人這種方式來寄托思念。
比如在三年前,當時最先進的對話系統,還是由GPT-3驅動。一位因未婚妻離世而備受折磨的青年約書亞,就決定用技術“復活”亡妻。
根據程序設定, “她”和人類一樣有著生老病死,每說一句話,壽命就減少一點。
當“她”隻剩20%壽命後,會開始胡言亂語。當系統壽命耗盡到0%,虛擬人的生命也走向終結。
如今,隨著技術發展逐漸成熟,遠去之人的身影已經可以做到具象化。說話風格、語音語調、還有外在形象也都能完整地保留。
這段時間,視頻生成的進展如火如荼。像阿裡就發佈個由音頻驅動的肖像視頻生成框架——EMO。
輸入單張參考圖像,以及一段音頻(說話、唱歌、rap均可),就能生成表情生動的AI視頻。
於是就有人生成哥哥張國榮,為大傢帶來一首陳奕迅粵語版的《無條件》。
或許之後隨著技術逐漸進化,人類的思念也將有實實在在的歸處。
最後,沒想到還能再以這種方式見到湯曉鷗教授。感念!