Google有大麻煩!外媒爆料說,Bard的訓練數據部分來自ChatGPT。Google可能跳到黃河裡也洗不清。3月29日,外媒TheInformation曝出一個驚天大瓜!Google的離職員工、已跳槽OpenAI的頂級研究員竟然曝出——Bard竟是用ChatGPT的數據訓練的!
如果事情為真,這可真算得上是Google的頂級醜聞。
對抗ChatGPT的AI,竟然用的是ChatGPT的訓練數據,這可太諷刺。
並且,這也明顯違反OpenAI的服務條款——要知道,微軟擁有將ChatGPT用於商業目的的獨傢許可,Google因此很可能要吃官司。
訓練Bard,Google竟‘借用’ChatGPT的數據?
Jacob Devlin這個名字,可謂如雷貫耳。Google在2018年發表的BERT模型的論文,Devlin就是一作。
正是這篇論文,引發學術界AI研究的熱潮。而Devlin的研究,可以說為Google和OpenAI的語言模型奠定很大的基礎。
論文地址:https://arxiv.org/pdf/1810.04805.pdf
雖然Devlin跳槽到OpenAI,是今年1月的事,我們很早就知道。
但是Bard用ChatGPT數據訓練的事,卻是最近才曝出。
根據The Information的報道,Devlin從Google離職的原因之一,就是他發現Google用於對抗ChatGPT的種子選手——Bard在訓練時,用的正是ChatGPT的數據。
他警告CEO劈柴和其他高管,告訴他們Bard團隊正在使用來自ShareGPT的信息訓練,隨後辭職。
爆料一發出,業界人士們都炸。
有網友評論道:‘這可是業內大忌啊。’
而當事人之一、ShareGPT的創建人Steven Tey表示,其實自己早就知道這個事,並且此事早就在Google內部傳開,許多員工對此很不滿,很擔憂。
隨後,他又發帖說,這下,貓可從口袋裡跑出來吧。(諺語,指無意間泄密)
這也是為什麼我們上周關閉ShareGPT的Explore頁面,其中有超112k的共享對話數據。
太瘋狂!
其實是個‘套殼’ChatGPT?
ShareGPT,是Steven Tey和Dom Eccleston在2022年12月共同創建的一個Chrome擴展,能夠捕捉和分享人們在ChatGPT中的對話內容。
通過捕獲他人與ChatGPT的完整對話,ShareGPT能生成一個URL。通過這個擴展,人們可以直接分享URL,省去截取多個對話截圖的時間。
也就是說,如果用ShareGPT的信息訓練Bard,很可能把Bard訓練成一個‘翻版ChatGPT’。
據內部人士透露,Devlin發出警告後,Google立馬停止利用這些數據來訓練Bard。
但在外媒The Verge就該事件詢問Google發言人Chris Pappas時,他卻否認。
他很肯定地說,‘Bard的訓練沒有使用任何來自ShareGPT或ChatGPT的數據。’
到底用沒用呢?此事目前還是個羅生門。
有意思是,OpenAI此前就經常陷入爭議,許多網站和藝術傢指控ChatGPT是從自己這裡竊取的數據。
而今天,這是第一次有人指控別的公司從ChatGPT竊取數據。
就是說,貴圈真的是個圈。
Google的反擊,有些狼狽
此前,大火的ChatGPT整合進必應中,已經導致Google的股價下跌。
搜索巨頭地位被撼動的Google,正在不顧一切地迎頭追趕。
結果Bard在發佈會上當場出錯,讓Google淪為笑柄,市值蒸發1000億。
遮遮掩掩一個多月,Bard終於正式開放。大傢使用後發現,Bard正確率不算高,寫代碼也不太行,比起ChatGPT來,要更拉跨一些。
而最關鍵的問題其實是,Bard已經晚一步。即使正式發佈,媒體和坊間都反響,似乎無人在意。
而Devlin離職Google、加入OpenAI的選擇,更是寓意深刻——既然Google如此嚴重依賴ShareGPT,那大神就幹脆加入OpenAI,不用中間商。
而更嚴重的是,微軟擁有將ChatGPT用於商業目的的獨傢許可。
因此,Devlin擔心Google以這種方式使用數據,違反OpenAI的服務條款。如果此事得到證實,Google很可能面臨訴訟。
當然,OpenAI也並不清白。訓練ChatGPT的數據,也是從公共互聯網上‘借用’的。這些內容,其實也未經藝術傢、作傢、攝像師等人類創作者的許可。
雖然微軟最近確實宣佈一些補償計劃,要補償為Bing Chat的答案做出貢獻的內容創作者。
但說到底,無論是Google還是微軟,它們唯一真正關心的事情,還是股東的利潤。
Google大腦和DeepMind聯姻
而The Information的報道中除有上面那個大瓜,還有另一個瓜。
ChatGPT自去年11月ChatGPT爆火之後,Google和OpenAI之間的軍備競賽,就日益劍拔弩張。
現在,為對抗ChatGPT,Google的兩個最強‘大腦’——DeepMind和Google Brain,已經選擇強強聯手。
據兩位知情人士透露,DeepMind和Google Brain最近幾周正在開發與OpenAI競爭的另一產品,內部代號為Gemini(雙子座)。
Sundar Pichai、Demis Hassabis和Jef Dean(從左起)
自Google2014年收購DeepMind以來,DeepMind先後發佈幾款令人世人驚艷的人工智能,比如AlphaGO、AlphaCode、AlphaFold。可以說,風頭遠遠超過Google。
自ChatGPT發佈後,Google大腦時不時更新一些進展,然而DeepMind一直還公佈近來的大動作。
而現在,Alphabet這兩個人工智能實驗室的員工都認為,OpenAI已經遠遠超越他們。再加上,許多關鍵工程師和研究人員紛紛流向OpenAI,讓Google內部人士紛紛堪憂。
加上上周Bard向部分用戶開放後,表現又比不上ChatGPT。
眼看自己親手培養的孩子Bard不如人意,Google研究人員幹脆再要一個,目標是要能與GPT-4一戰。
由此看來,Gemini(雙子座)重要性不言而喻。
其中一位知情人士表示,Google大腦的負責人、Google資深人工智能研究主管Jef Dean已經在該項目中都自己手動敲代碼。
可以說,Gemini的誕生是被迫聯姻的孩子。因為,此前DeepMind和Google Brain這兩個實驗室很少相互合作或共享計算機代碼。
一位知情人士表示,但現在,由於雙方都希望開發自己的機器學習模型,以與OpenAI競爭,而且需要大量的計算能力。因此他們別無選擇,隻能合作。
如今,這一努力讓Google在搜索和雲方面等無數團隊的產品路線,因ChatGPT的競爭而受到動搖。
沒錢賺,Google Assistant重組
這不,就在近日,Google Assistant部門面臨重組,以專註研發Bard。
在給員工的一份備忘錄‘Changes to Assistant and Bard teams’中,列出許多高管變動。
一位Google Assistant工程副總裁Amar Subramanya現在將領導Bard。而另一位工程副總毛建昌‘因個人原因’離開Google,Google商務部門副總裁Peeyush Ranjan成為接盤者。
Google Assistant業務部門副總裁兼負責人Sissie Hsiao在這份備忘錄中稱,‘鑒於Bard團隊的不懈努力,我們希望繼續支持並執行未來研究項目。’
這聽起來像Assistant團隊現在支持Google以對抗ChatGPT‘紅色代碼’的戰鬥。
Google Assistant註定是失敗嗎?其實,越來越多的證據表明該部門正在走下坡路:
從2016年到2021年,Google Assistant在五年內發佈八個主要的揚聲器/智能顯示器硬件,但硬件發佈似乎已經停止。上一次硬件發佈是在2021年3月。那是整整兩年前的事。
2022年,Google從兩個內部產品線中移除Assistant支持:Nest Wi-Fi和Fitbit可穿戴設備。
2022年還看到The Information的一份報告,該報告稱Google希望‘減少投資開發其用於汽車和非Google制造的設備的Google Assistant語音輔助搜索’。
Google Assistant的駕駛模式於2022年關閉。
Google Assistant的‘Duplex on the web’功能也於2022年關閉。
Google Assistant的一項核心獨特功能Reminders即將被關閉,取而代之的是Google Task Reminders。
Google Assistant從來沒有賺錢過。硬件以成本價出售,沒有廣告,而且沒有人支付月費來使用 Google 助理。處理所有這些語音命令的服務器成本也很高,盡管一些較新的設備已經以隱蔽的成本削減舉措轉移到設備上處理。Assistant 最大的競爭對手亞馬遜 Alexa 也處於同一條船上,每年虧損100億美元。
從Google Assistant這些年的發展也可以看出,Google的運作方式真的太封建。
這傢公司似乎有一種約定俗成的觀點,即讓項目在現有產品(如地圖或助手)的支持下運轉,才是一種可靠的掙錢方式。
因此,盡管公司裡已經囤積許多世界上最優秀的AI研究人員,但他們的才能似乎隻能受困於企業戰略的軌道。
在Bard之前,Google這些年在AI市場化上的進步,無非就是不斷改進Google Assistant等一些小玩意,用AI做一些邊角料。
這樣一個巨頭,本應是順應趨勢、推動潮流、攪動世界的。