3月16日,李彥宏攜百度文心一言亮相,並宣佈開放邀請測試。雖然文心一言的能力受到質疑,但毋庸置疑的是,百度是全球第一個挑戰ChatGPT的大廠。李彥宏也已經預見,文心一言在與ChatGPT正面比較時會令大眾失望,但百度認為,文心一言有兩大優勢:一是,畫圖、寫長文、文字轉視頻等多模態生態能力是ChatGPT所不具備的;二是,文心一言具備中文理解能力優勢。
但是,百度自詡的優勢也許會成為文心一言所面臨的大問題。近日,有網友在對百度文心一言AI作畫功能進行大量測試後產生懷疑,認為其可能隻是一個套殼的AI模型,先將用戶的中文指令翻譯成英文,然後用國外開源的AI模型生成作品。百度方面針對此回應表示,文心一言完全是百度自研的大語言模型,文生圖能力來自文心跨模態大模型ERNIE-ViLG。
不過《IT時報》記者發現,百度低調向百傢號入駐作者開放的AI圖文轉視頻功能存在版權風險:百度視頻素材來源不明。但這一風險被轉嫁至媒體及其他百傢號作者,若被告侵權,作者將承擔巨大的版權風險。截至發稿,百度沒有對文心一言版權問題進行回復。
百度即將在今天(3月27日)上線文心一言雲服務,屆時,AI寫作、AI作圖、AI文字生成視頻等功能都有可能對外開放,這些危險的AI生成作品,也許會把百度席卷至版權風暴之中。
AI視頻潛藏版權風險
《IT時報》記者實測比較百度文心一言和微軟必應ChatGPT後發現,文心一言在文學創作、商業文案創作、數理推算方面仍有較大的追趕空間。但正如李彥宏所言,百度文心一言的優勢在中文理解和多模態生成能力。
李彥宏表示,文心一言目前版本已經能生成文字、圖片和語音。生成視頻因為成本比較高,還沒有對所有用戶開放,未來百度會逐步接入。但熟悉百傢號創作的用戶,不少都已經體驗過這個功能,每天有幾萬篇文章通過這個能力轉成視頻內容在百度平臺分發。
但是,巨大的版權風險正潛藏在這每天幾萬條根據文字自動生成的視頻中。
百度AI文字轉視頻功能早在2022年3月就已在百傢號低調上線,百傢號作者鮮少第一時間發現,是因為這一功能是在發佈文章時默認勾選。在默認勾選狀態下,百度AI會自動根據文字內容尋找合適的視頻素材,生成視頻後並自動發佈,其中文章配圖隻占10%以內的占比,其他視頻素材均來自百度視頻庫。
這是屬於文心一言AIGC(人工智能自主生成內容)的TTV(文本內容情感化分析)功能。危險的是,百度並未公開其AI視頻素材來源。多位百傢號工作人員向《IT時報》記者表示,的確存在版權風險,至於其視頻素材來源,一部分由百度進行版權采買,一部分是公開CC0(放棄版權)素材,建議不發到百度站外,或關閉該功能。
目前,這些AI視頻主要自動發佈在百傢號及百度好看視頻平臺,但可以下載。“如果在百度平臺內,可能由百度來處理版權糾紛,但目前還沒解到有什麼版權侵權的案例。”百度百傢號工作人員向《IT時報》記者透露。
但在社交平臺上,多名百傢號作者表示,AI根據其文章自動生成的視頻被投訴侵權,其賬號信用分被扣至0分而被封禁。還有百傢號作者表示,AI自動生成視頻中疑似含有版權水印。
《IT時報》記者發現,百度AI視頻庫裡還有不少電視臺等媒體拍攝視頻,但無處查詢視頻素材出處。
百傢號隻在圖文轉視頻的相關權益說明中提到,“如果您是原創視頻作者,那麼您發佈的圖文為原創時,轉出的視頻會自動聲明該視頻為原創視頻,並且視頻的閱讀收益歸您所有。”
截至發稿,百度沒有對文心一言AI視頻來源等問題做出回復。
風險轉嫁至作者
更不合理的是,百度可以無償使用百傢號作者上傳的內容,又將版權風險轉嫁給百傢號作者。
百傢號在平臺服務協議9.7條中提到:“您使用百傢號平臺服務上傳、發佈或傳輸內容即代表您有權且同意在全世界范圍內,永久性地、不可撤銷地、免費地授予百度及其關聯方對該內容的存儲、使用、發佈、復制、修改、改編、出版、翻譯、據以創作衍生作品、傳播、表演和展示等權利;將內容的全部或部分編入其他任何形式的作品、媒體、技術中的權利;對您的上傳、發佈的內容進行商業開發的權利……以及再授權給其他第三方以上述方式使用的權利。”
據此協議理解,百度有權使用百傢號A作者上傳的文字、圖片、視頻等內容,編入B作者的作品中,甚至用於商業用途,完全不需要得到A作者的授權,也不需要付費給A作者。
《IT時報》記者查詢抖音及其他新聞媒體平臺與作者簽訂的協議發現,並沒有存在如百度百傢號這般不合理的條款。
上海大邦律師事務所高級合夥人、知識產權律師遊雲庭解讀認為,如果上述條款有效,那百度就可以使用這些視頻素材,不構成侵權也無須支付對價,如果該條款被法院認定為無效,則百度對外使用就構成侵權。
而當該條款遇上AI生成內容,潛藏的版權風險將對百傢號作者更加不利。遊雲庭認為,文字內容是媒體創作的,百度隻是提供技術服務,因為AI生成的視頻是無權享受著作權的,所以知識產權應該歸媒體所有。媒體發佈的視頻,對外應該由媒體承擔責任,如果權利人起訴媒體就是媒體承擔責任,如果權利人起訴雙方共同侵權,則構成連帶侵權責任。
“由百度提供模型,素材庫按照百度的合同規則使用的情況下,發生侵權可能責任是百度的。這當中任何一個節點發生變化,可能就是使用者的責任或者共同責任。這裡面變量很多,要看具體細節。判斷依據是人工智能生成品是不是侵權,模型數據提供者和使用者有沒有過錯等。”上海段和段律師事務所合夥人劉春泉認為,人工智能生成品有沒有版權?與責任風險由誰承擔?應該按照權利義務相一致原則來處理。純粹人工智能生成品與動物按快門拍照片和大象畫畫一樣沒有版權。但是人利用AI作為工具制作的產品,符合法律規定的構成作品,可以受保護。
制作1條AI視頻最低9.99元
《IT時報》記者發現,百度已經在進行文心一言的商業化嘗試,而上述AI文字轉視頻的服務正是文心一言雲服務的主要盈利點。
目前,百度大腦智能創作平臺推出兩種會員套餐,視頻創作會員1698元/月,智能寫作會員198元/月。其中,視頻創作會員的權益就包括每月50次圖文轉視頻等。此外,圖文轉視頻200條的報價是1998元,50條的報價是698元,20條的報價是298元,也就是說,1條圖文轉視頻的價格最低是9.99元。
“目前不管是API還是線上售賣的套餐,我們都沒接入素材庫。”百度雲客戶經理沒有正面回答文字轉視頻素材來源的問題,但就AI生成圖片的版權問題回復表示:“AI生成內容的可版權性在法律上仍處於不確定狀態,百度不限制您將生成圖片用於商業用途,但您應確保自身使用行為的合法合規性,在享有生成圖片使用權益的同時,自行承擔使用生成圖片的一切後果。”
截至3月27日,百度大腦智能創作平臺顯示,其自動創作文章已超200萬篇,自動創作短視頻已超15萬條。
風口上的百度急
“現在百度最卷的部門已經不是自動駕駛,而是文心一言。”一位百度自動駕駛部門的員工說道。
基於20多年搜索業務的積累,百度建立起世界上最大的知識圖譜,包含50億實體、5500億級事實,每天調用量超過400億次。受益於百度知識圖譜,文心大模型也成為全球首個知識增強千億級大模型。研究表明,數據達到千億級,大模型就可能發生“智能湧現”,但最快跑出ChatGPT的為什麼不是百度?
過去10年,百度在AI領域投入超1100億元的研發費用,2019年就推出文心大模型ERNIE 1.0。論起步時間,文心一言並不比ChatGPT晚,但論專註度,百度沒有OpenAI聚焦。此前百度之前一直將最大的精力投向自動駕駛,以及一系列的AI風口追逐,當初希壤也讓百度爭得國內元宇宙“頭號玩傢”等名號。
“百度的主要收入還是搜索廣告,這也是百度為什麼著急做文心一言的原因之一。”一位百度昆侖芯的員工認為。
ChatGPT焦慮已經是業內的常態。
國內ChatGPT模型跟OpenAI的差距到底在哪裡?“算法上還有細節要打磨,其次,高質量的文本數據還需要多積累。”一傢研發GPT模型公司CEO對《IT時報》記者道出多數國內ChatGPT從業者的現實和心態,“類ChatGPT的產品可能有版權上的顧慮,但先把技術用起來,以後再想辦法更好地規范。”
不過,也有一傢國內AI大廠的相關人士對《IT時報》記者表示,目前已跑出AI作圖等ChatGPT大模型,但是主要考慮到版權等風險,沒有快速上線。
AI版權風暴即將來襲
最近,網易旗下輕博客社區LOFTER上的大量創作者刪檔銷號,退出平臺,用行動抵制AI作畫。起因是網易LOFTER上線AI作畫功能“老福鴿畫畫機”,部分創作者認為該功能可能用到原創作者的畫作,有侵犯版權之嫌。
對此,網易LOFTER強調“該功能訓練集來自於開源,沒有使用LOFTER用戶的作品數據,並明確註明不得用於商業用途”。3月16日,網易LOFTER官微向創作者發出一份公開致歉信,為傷害很多創作者而表達歉意。該AI作畫功能已於3月8日下線,網易LOFTER單獨設立的“AI內容冒充原創”反侵權投訴渠道,截至3月25日收到1148條舉報投訴。
在國外,AI侵權問題已經引起社會關註。近日,《華爾街日報》等多傢國外主流新聞媒體指控OpenAI及其聊天機器人模型ChatGPT未經許可使用新聞來源進行訓練,並拒絕向媒體支付相關費用。
早在2022年,一名程序員起訴GitHub、微軟和OpenAI,指控GitHub Copilot的AI編程工具抄襲代碼。今年1月,一群藝術傢起訴AI繪畫Stability AI Ltd.、Midjourney Inc.和DeviantArt Inc.,聲稱這些公司下載並使用數十億張受版權保護的圖像,但沒有獲得藝術傢的授權並對其進行補償。
一場AIGC的版權風暴正在來襲。
2月15日,愛奇藝宣佈將全面接入百度文心一言,雙方將共同探索AIGC在內容搜索、內容宣發、內容創作工具、小說創作等業務上的應用。近期,文心一言開發的AI文檔寫作助手也將上線百度文庫,作者隻要輸入主題及內容要求,AI寫作助手就能幫助搜集資料、搭建框架、填充內容、理順文檔、制造亮點,最終生成范文。
李彥宏認為,多模態生成能力是ChatGPT不具備的能力,這是文心一言的優勢。但是,百度一旦開放AI寫作、AI作圖、AI文字生成視頻等,受到的版權類指控並不會比ChatGPT少。訓練數據是否得到授權,AI生成作品是否涉嫌侵權等問題會接踵而至。
關於AI生成內容的版權問題正在業內掀起大討論。
知識產權界絕大多數專傢都認為,AI生成內容是不受版權保護的。中國社會科學院知識產權中心主任李明德認為,《著作權法》隻保護人的作品,AI生成的內容不是作品,沒有版權。隻有個人使用存在免責情況,公司拿媒體的作品去訓練AI,但沒有拿到媒體的授權,就構成侵權,文字三四行就能構成作品,視頻每一幀都是作品。