快科技8月6日消息,據媒體報道,NVIDIA正在訓練尚未向公眾發佈,內部命名為Cosmos的AI項目。
該項目旨在構建一個集合光傳輸、物理和智能模擬的先進視頻模型,以支持Omniverse 3D世界生成器、自動駕駛汽車系統和數字人產品等下遊應用。
內部文件顯示,英偉達正在從Youtube和其他來源抓取視頻,收集用於這一AI產品的訓練數據。
為收集訓練視頻,NVIDIA員工使用名為yt-dlp的開源 YouTube 視頻下載器,能夠通過虛擬機刷新IP地址,規避平臺的反爬蟲機制。
通過使用20到30臺虛擬機,NVIDIA每天瘋狂地爬取相當於80年時長的視頻。
然而,這一行為被指可能違反版權法和平臺的使用條款,盡管NVIDIA方面回應稱其做法完全合法,但谷歌和奈飛均表示,未與NVIDIA達成內容提取協議,且平臺服務條款禁止內容抓取。