距離3月16日百度公司推出類似ChatGPT的聊天機器人還有一周時間,這傢中國最大的搜索引擎運營商的員工表示,他們正在抓緊時間趕在最後期限前推出,而這款聊天機器人仍難以完成一些基本功能。
據知情人士向華爾街日報透露,為開發這款名為Ernie Bot的人工智能聊天機器人,數百名員工一直在夜以繼日地工作。他們表示,其他團隊已被要求借出他們的員工和強大的計算機芯片,因為美國的制裁,中國公司無法再購買這些芯片。
一些知情人士表示,在預計推出之前,作為聊天機器人基礎的人工智能模型仍在接受數據訓練,這是中國科技行業備受期待的一件事。一些員工表示,他們沒有足夠的時間來打造一款功能良好的產品。
知情人士還表示,百度計劃分階段推出這款產品,首先向有限的用戶開放公開測試。上個月,百度表示首先將Ernie Bot嵌入到其搜索引擎中,並將於3月向公眾開放。
百度的美國存托憑證周四下跌7.5%。納斯達克金龍中國指數下跌5.4%。
百度表示已與400多傢中國公司簽署協議,這些公司將能夠在其產品和服務中使用Ernie Bot。百度表示,作為回報,聊天機器人將獲得在不同場景中運行的經驗,以幫助提高其性能。
百度近年來失去投資者的青睞,成功上市可能有助於該公司重新躋身中國著名科技公司的行列。失敗可能會導致百度遭受與Google類似的命運,直到最近,Google一直堅持對人工智能采取相對謹慎的態度,Google的人工智能聊天機器人搜索在演示中產生與事實不符的錯誤後,其市值損失1000億美元。
百度拒絕對此置評。
Ernie Bot可能是中國第一個與ChatGPT競爭的產品,ChatGPT是由位於舊金山的人工智能研究公司OpenAI開發的。中國和美國一直在競相增強各自的戰略技術優勢。
知情人士表示,北京市官員還提醒百度,確保其服務符合中國的法律法規,包括數據收集和處理,以及國傢嚴格的互聯網審查規定。
本周,中國科技部部長王志剛表示,開發類似ChatGPT的產品將很困難:“踢足球就是運球和射門,但要像梅西那樣出色並不容易,”他補充道,中國長期以來一直在研究這一領域,但“我們必須等等看,我們是否能取得像OpenAI那樣的成果。”
多年來,百度一直在大力投資開發大型語言模型,這是ChatGPT將Google和OpenAI的英語版本改編為中文的技術基礎。百度在2019年發佈第一款模型,取名為Ernie。
去年12月底,隨著ChatGPT的熱度越來越高,百度首席執行官李彥宏向員工介紹新的進展。根據《華爾街日報》看到的一份內部記錄,他表示:“我們有這麼酷的技術,但我們能把它變成每個人都需要的產品嗎?這實際上是最困難的一步,但也是最偉大、最有影響力的一步。”
知情人士表示,今年1月初,百度的高管告訴其自然語言處理團隊,開始將類似ChatGPT的產品與Ernie模型結合起來。
但他們表示,該項目面臨著挑戰,其中許多挑戰已被其他從事類似ChatGPT技術的人工智能開發人員所共享。一個挑戰是讓模型更準確地響應用戶的請求,教它消除具有多種含義的短語或可以指代多個人的名稱之間的歧義。另一個挑戰是讓聊天機器人生成更像人類的語言。
第三個挑戰是提高其事實準確性,這是大型語言模型的技術限制。大型語言模型是根據不同單詞出現在一起的概率而不是根據信息片段來組合句子的。這種限制也使得這些模型難以控制,從而避免敏感話題,這是審查的障礙。
知情人士表示,百度已聘請承包商幫助審查和改進聊天機器人的答案。
知情人士表示,每一步都需要時間。人工智能研究人員表示,正確訓練這種擁有數千個芯片的模型可能需要幾周或幾個月的時間。
知情人士表示,本周,工程師和產品經理都在忙著改進Ernie Bot的基本功能,比如它對用戶請求的響應速度,以及它匯總搜索結果的方式。
知情人士表示,開發團隊一直沒日沒夜地工作,包括1月底為期一周的春節假期。他們表示,該項目目前已從創建一個能夠用中文和英語對話的雙語聊天機器人簡化為一個主要用中文對話的聊天機器人。
知情人士表示,Ernie Bot的研發工作一直由百度的首席技術官王海峰負責,主要由百度技術開發部門進行,該部門包括自然語言處理團隊和移動生態系統業務集團。一些知情人士表示,百度的人工智能雲部門正在提供雲計算支持。
為加快這一進程,高管們集中更多的資源。知情人士表示,春節假期結束後,李彥宏要求全公司的人工智能研究團隊(包括其自動駕駛部門)借來其最強大的計算機芯片英偉達公司的A100用於Ernie Bot開發。美國去年年底實施的芯片制裁禁止中國公司購買新的A100芯片。一些知情人士表示,公司還調來員工幫忙,特別是清理培訓數據,比如過濾掉低質量的內容。百度還聘請外部團隊進行數據清理。
由於時間緊張,一些員工對Ernie Bot能否達到用戶或市場的預期感到不安。一些員工表示,出於這些擔憂,他們已在發佈前出售一些公司股票。