谷歌Bard被曝剽竊ChatGPT?BERT一作跳槽OpenAI揭驚天內幕


Google有大麻煩!外媒爆料說,Bard的訓練數據部分來自ChatGPT。Google可能跳到黃河裡也洗不清。3月29日,外媒TheInformation曝出一個驚天大瓜!Google的離職員工、已跳槽OpenAI的頂級研究員竟然曝出——Bard竟是用ChatGPT的數據訓練的!

如果事情為真,這可真算得上是Google的頂級醜聞。

對抗ChatGPT的AI,竟然用的是ChatGPT的訓練數據,這可太諷刺。

並且,這也明顯違反OpenAI的服務條款——要知道,微軟擁有將ChatGPT用於商業目的的獨傢許可,Google因此很可能要吃官司。


訓練Bard,Google竟‘借用’ChatGPT的數據?

Jacob Devlin這個名字,可謂如雷貫耳。Google在2018年發表的BERT模型的論文,Devlin就是一作。

正是這篇論文,引發學術界AI研究的熱潮。而Devlin的研究,可以說為Google和OpenAI的語言模型奠定很大的基礎。


論文地址:https://arxiv.org/pdf/1810.04805.pdf

雖然Devlin跳槽到OpenAI,是今年1月的事,我們很早就知道。

但是Bard用ChatGPT數據訓練的事,卻是最近才曝出。

根據The Information的報道,Devlin從Google離職的原因之一,就是他發現Google用於對抗ChatGPT的種子選手——Bard在訓練時,用的正是ChatGPT的數據。

他警告CEO劈柴和其他高管,告訴他們Bard團隊正在使用來自ShareGPT的信息訓練,隨後辭職。


爆料一發出,業界人士們都炸。

有網友評論道:‘這可是業內大忌啊。’


而當事人之一、ShareGPT的創建人Steven Tey表示,其實自己早就知道這個事,並且此事早就在Google內部傳開,許多員工對此很不滿,很擔憂。


隨後,他又發帖說,這下,貓可從口袋裡跑出來吧。(諺語,指無意間泄密)

這也是為什麼我們上周關閉ShareGPT的Explore頁面,其中有超112k的共享對話數據。

太瘋狂!


其實是個‘套殼’ChatGPT?

ShareGPT,是Steven Tey和Dom Eccleston在2022年12月共同創建的一個Chrome擴展,能夠捕捉和分享人們在ChatGPT中的對話內容。


通過捕獲他人與ChatGPT的完整對話,ShareGPT能生成一個URL。通過這個擴展,人們可以直接分享URL,省去截取多個對話截圖的時間。

也就是說,如果用ShareGPT的信息訓練Bard,很可能把Bard訓練成一個‘翻版ChatGPT’。

據內部人士透露,Devlin發出警告後,Google立馬停止利用這些數據來訓練Bard。

但在外媒The Verge就該事件詢問Google發言人Chris Pappas時,他卻否認。


他很肯定地說,‘Bard的訓練沒有使用任何來自ShareGPT或ChatGPT的數據。’

到底用沒用呢?此事目前還是個羅生門。

有意思是,OpenAI此前就經常陷入爭議,許多網站和藝術傢指控ChatGPT是從自己這裡竊取的數據。

而今天,這是第一次有人指控別的公司從ChatGPT竊取數據。

就是說,貴圈真的是個圈。

Google的反擊,有些狼狽

此前,大火的ChatGPT整合進必應中,已經導致Google的股價下跌。

搜索巨頭地位被撼動的Google,正在不顧一切地迎頭追趕。

結果Bard在發佈會上當場出錯,讓Google淪為笑柄,市值蒸發1000億。

遮遮掩掩一個多月,Bard終於正式開放。大傢使用後發現,Bard正確率不算高,寫代碼也不太行,比起ChatGPT來,要更拉跨一些。


而最關鍵的問題其實是,Bard已經晚一步。即使正式發佈,媒體和坊間都反響,似乎無人在意。

而Devlin離職Google、加入OpenAI的選擇,更是寓意深刻——既然Google如此嚴重依賴ShareGPT,那大神就幹脆加入OpenAI,不用中間商。

而更嚴重的是,微軟擁有將ChatGPT用於商業目的的獨傢許可。

因此,Devlin擔心Google以這種方式使用數據,違反OpenAI的服務條款。如果此事得到證實,Google很可能面臨訴訟。

當然,OpenAI也並不清白。訓練ChatGPT的數據,也是從公共互聯網上‘借用’的。這些內容,其實也未經藝術傢、作傢、攝像師等人類創作者的許可。

雖然微軟最近確實宣佈一些補償計劃,要補償為Bing Chat的答案做出貢獻的內容創作者。

但說到底,無論是Google還是微軟,它們唯一真正關心的事情,還是股東的利潤。


Google大腦和DeepMind聯姻

而The Information的報道中除有上面那個大瓜,還有另一個瓜。

ChatGPT自去年11月ChatGPT爆火之後,Google和OpenAI之間的軍備競賽,就日益劍拔弩張。

現在,為對抗ChatGPT,Google的兩個最強‘大腦’——DeepMind和Google Brain,已經選擇強強聯手。

據兩位知情人士透露,DeepMind和Google Brain最近幾周正在開發與OpenAI競爭的另一產品,內部代號為Gemini(雙子座)。


Sundar Pichai、Demis Hassabis和Jef Dean(從左起)

自Google2014年收購DeepMind以來,DeepMind先後發佈幾款令人世人驚艷的人工智能,比如AlphaGO、AlphaCode、AlphaFold。可以說,風頭遠遠超過Google。

自ChatGPT發佈後,Google大腦時不時更新一些進展,然而DeepMind一直還公佈近來的大動作。

而現在,Alphabet這兩個人工智能實驗室的員工都認為,OpenAI已經遠遠超越他們。再加上,許多關鍵工程師和研究人員紛紛流向OpenAI,讓Google內部人士紛紛堪憂。

加上上周Bard向部分用戶開放後,表現又比不上ChatGPT。

眼看自己親手培養的孩子Bard不如人意,Google研究人員幹脆再要一個,目標是要能與GPT-4一戰。


由此看來,Gemini(雙子座)重要性不言而喻。

其中一位知情人士表示,Google大腦的負責人、Google資深人工智能研究主管Jef Dean已經在該項目中都自己手動敲代碼。

可以說,Gemini的誕生是被迫聯姻的孩子。因為,此前DeepMind和Google Brain這兩個實驗室很少相互合作或共享計算機代碼。

一位知情人士表示,但現在,由於雙方都希望開發自己的機器學習模型,以與OpenAI競爭,而且需要大量的計算能力。因此他們別無選擇,隻能合作。

如今,這一努力讓Google在搜索和雲方面等無數團隊的產品路線,因ChatGPT的競爭而受到動搖。

沒錢賺,Google Assistant重組

這不,就在近日,Google Assistant部門面臨重組,以專註研發Bard。

在給員工的一份備忘錄‘Changes to Assistant and Bard teams’中,列出許多高管變動。

一位Google Assistant工程副總裁Amar Subramanya現在將領導Bard。而另一位工程副總毛建昌‘因個人原因’離開Google,Google商務部門副總裁Peeyush Ranjan成為接盤者。

Google Assistant業務部門副總裁兼負責人Sissie Hsiao在這份備忘錄中稱,‘鑒於Bard團隊的不懈努力,我們希望繼續支持並執行未來研究項目。’

這聽起來像Assistant團隊現在支持Google以對抗ChatGPT‘紅色代碼’的戰鬥。


Google Assistant註定是失敗嗎?其實,越來越多的證據表明該部門正在走下坡路:

  • 從2016年到2021年,Google Assistant在五年內發佈八個主要的揚聲器/智能顯示器硬件,但硬件發佈似乎已經停止。上一次硬件發佈是在2021年3月。那是整整兩年前的事。

  • 2022年,Google從兩個內部產品線中移除Assistant支持:Nest Wi-Fi和Fitbit可穿戴設備。

  • 2022年還看到The Information的一份報告,該報告稱Google希望‘減少投資開發其用於汽車和非Google制造的設備的Google Assistant語音輔助搜索’。

  • Google Assistant的駕駛模式於2022年關閉。

  • Google Assistant的‘Duplex on the web’功能也於2022年關閉。

  • Google Assistant的一項核心獨特功能Reminders即將被關閉,取而代之的是Google Task Reminders。

  • Google Assistant從來沒有賺錢過。硬件以成本價出售,沒有廣告,而且沒有人支付月費來使用 Google 助理。處理所有這些語音命令的服務器成本也很高,盡管一些較新的設備已經以隱蔽的成本削減舉措轉移到設備上處理。Assistant 最大的競爭對手亞馬遜 Alexa 也處於同一條船上,每年虧損100億美元。

從Google Assistant這些年的發展也可以看出,Google的運作方式真的太封建。

這傢公司似乎有一種約定俗成的觀點,即讓項目在現有產品(如地圖或助手)的支持下運轉,才是一種可靠的掙錢方式。

因此,盡管公司裡已經囤積許多世界上最優秀的AI研究人員,但他們的才能似乎隻能受困於企業戰略的軌道。

在Bard之前,Google這些年在AI市場化上的進步,無非就是不斷改進Google Assistant等一些小玩意,用AI做一些邊角料。

這樣一個巨頭,本應是順應趨勢、推動潮流、攪動世界的。


相關推薦

2023-03-31

自ShareGPT平臺的信息,如果這樣訓練的話,可能會讓Bard與ChatGPT過於相似。消息人士表示,在德弗林就這個問題對谷歌高管發出警告後,谷歌就停止使用這些數據來訓練Bard。據悉,德弗林在谷歌工作五年多的時間,2018年他作為主

2023-02-15

幾個月裡挖至少十幾名GoogleAI的員工,而這些工程師都在ChatGPT的研究中發揮至關重要的作用。如今已經沒人能否認,OpenAI憑ChatGPT火遍全球。所有AI從業者和投資人都想知道,一傢成立7年的小初創公司,究竟是如何擊敗Google的。

2023-03-22

過去幾個月的快速進步之際,尤其是微軟支持的OpenAI及其ChatGPT的快速進步。Bard最初於今年1月發佈,但谷歌卻因此遭到員工和投資者的批評,因為這似乎是在微軟宣佈將ChatGPT整合到必應搜索之後而做出的匆忙應對。在最近的全

2023-05-12

項產品與功能進行訓練,這其中就包括AI對話工具Bard。在ChatGPT發佈三個月後,今年2月谷歌發佈AI對話工具Bard,但因為Bard在產品功能展示過程中給出錯誤答案,谷歌市值在兩天內蒸發1000億美元。這個細節也可以看出,市場對Bard

2023-02-07

面對氣勢洶洶的OpenAIChatGPT,Google真的急!Google母公司AlphabetCEO皮查伊今日凌晨發文,正式揭曉其AI旅程的“NextStep”———Bard,一款與ChatGPT相似的對話式AI服務。值得註意的是,受限於數據集,ChatGPT無法回答2021年後的信息。而Go

2023-03-31

發的人工智能聊天機器人Bard正在用來自OpenAI聊天機器人ChatGPT的數據進行訓練。谷歌發言人則表示,“訓練Bard沒有用過任何來自ShareGPT或ChatGPT的數據。”據悉,用戶可以在ShareGPT這個平臺上發佈他們與聊天機器人ChatGPT所交流的信

2023-03-24

hapGPT施加重壓過去三個多月,科技行業最火的產品無疑是ChatGPT。OpenAI打造的這款生成式AI產品發佈之後火遍全球,讓用戶感受到前所未有的智能體驗,更直接帶動下一個科技風口,甚至卷到中國互聯網創投圈。另一方面,互聯網

2023-03-30

phabet旗下的一傢人工智能實驗室。谷歌之前為挑戰OpenAI的ChatGPT而推出Bard聊天機器人,但卻在演示現場意外翻車。此後不久,Alphabet決定啟動這個名為Gemini的聯合項目。一位著名谷歌人工智能研究員的辭職也對Bard的發佈產生內部

2023-02-10

谷歌在搜索領域的絕對主導地位居然還會面臨新挑戰。但ChatGPT的橫空出世和微軟的及時跟進,卻讓谷歌感受到前所未有的競爭壓力,而這場競爭的成敗則關系到谷歌的未來。對話工具橫空出世去年11月,創業公司OpenAI推出面向大

2023-11-26

的大部分最新功能。 公開資料顯示,今年OpenAI首次推出ChatGPT產品後,資本市場對生成性人工智能的關註度越來越高。 目前英偉達在人工智能芯片市場占據主導地位,它在AI處理器市場上占據大約80%的份額,其高端處理器已被

2023-02-01

2月1日消息,雖然AI研究公司OpenAI通過AI聊天機器人ChatGPT激發公眾的想象力,但歸根結底,這項技術可能不會改變科技巨頭之間的力量平衡。谷歌等科技巨頭將從所謂的生成式AI(AIGC)中獲益更多,而不是OpenAI這樣的創企。以下

2023-02-08

名為Bard的人工智能聊天機器人技術,以此與OpenAI旗下的ChatGPT展開競爭。後者的爆紅令不少分析師警告稱,谷歌的核心產品,即在線搜索功能,恐面臨多年來最重大的風險,甚至遭遇徹底顛覆。Wedbush分析師丹尼爾·艾夫斯(Daniel

2023-03-22

聊天機器人“巴德”(Bard)的測試版本,以期與OpenAI的ChatGPT展開競爭。Bard將與其谷歌搜索引擎分開運行,僅以英語生成答案。目前,谷歌僅允許美國和英國地區的用戶在官方網站進行註冊,並將以先到先得的方式向候補名單的

2023-02-18

聊天機器人ChatGPT爆火之下,各傢都在尋求切入角度。谷歌正手忙腳亂,因為有微軟+OpenAI打來的一記組合拳。微軟最近官宣要把類ChatGPT技術嵌入必應搜索引擎和自傢的Edge瀏覽器中。因為展現形式可能被顛覆,搜索界要迎來代際