中國的AI論文發表量全球第一,為什麼沒搞出ChatGPT?


最近幾個月世界上最大的科技新聞恐怕就是ChatGPT的火爆流行。ChatGPT是美國一個初創科技公司OpenAI開發的人工智能應用程序,2022年11月面向公眾開放,到今年1月已經積累1億用戶。

我也是這1億用戶中的一員。這段時間我使用ChatGPT的感受是,如果是在我本專業的經濟和金融搜索方面,我不會依賴它。由於我知道自己所需的大部分經濟和金融數據的原始來源在哪裡,我會直接去各個數據的發佈網站進行尋找。ChatGPT可能更方便,但是由於我的工作要求數據的準確性,所以略過人工智能這個中間層級反而更有效率。

但是在專業以外的地方,尤其是完全陌生的知識領域裡,ChatGPT是一個非常有用的輔助工具。就像我們平時身邊或則網上認識的某些“萬事通”朋友,他們說的不一定就是最正確的權威意見,但的確可以快速給出一個我們容易理解、方便進一步深入解事物的答案。

當然,如果僅僅是搜索輔助這樣的功能,那麼ChatGPT可能也就是一個更加智能的維基百科,並不值得現在這樣熱火朝天的關註度。它在搜索以外的各種場景應用,更是大傢關心的焦點。

就我個人來說,ChatGPT可能對我最大的幫助就是輔助處理各種初級任務。在工作中,我經常需要分析大量數據來尋找規律、分辨趨勢和研究各種異常的變化。但在將自己的研究結論整理成文字的時候,實際上大量的工作時間是用來完成一些初級的數據分析和文字工作,在做真正的深層數據挖掘之前,往往需要完成描述原始數據、畫圖做表、對圖表進行簡單描述等等繁瑣步驟。


當微軟宣佈將ChatGPT整合到自己的辦公軟件後,未來我可以將原始的經濟金融數據“一鍵生成”一份包含圖表和文字介紹的初稿。這個初稿裡隻要能完整、準確的描述原始數據和介紹圖表,那麼我就可以擺脫繁瑣的初級勞動,將主要的時間花在挖掘數據背後的故事、尋找數據變化帶來的機會和風險這樣真正核心的任務上。而當我完成一篇完整的分析之後,ChatGPT甚至可能“一鍵生成”一份精美的PPT,這樣工作效率當然就會成倍的提高。

現實中我們很多人都面對著大量繁瑣的文字工作,如果以後ChatGPT或者類似的人工智能軟件可以讓人“一鍵生成”這些文件,這對於工作效率的提高以及衍生出來的巨大商機的確難以想象。

我相信最近無數人都在思考著人工智能可能在自己的領域造成什麼樣的變化,而也有很多人在提問:為什麼ChatGPT這樣的技術成果沒有出現在中國?

ChatGPT的開發者OpenAI成立於2015年12月,最初是一個非盈利機構,在2019年轉變為盈利性公司。其主要創始人包括現任CEO山姆·阿爾特曼(Sam Altman)以及特斯拉的創始人馬斯克。按照後來的媒體報道,OpenAI的創始者本身就是美國科技領域的明星巨頭,所以他們出面聘請當時美國在人工智能方面最頂尖的一些技術專傢加入,而不少技術專傢因為可以和自己同水平的研究者合作機會難得,寧願降薪加入。

從2016年到2019年,作為非盈利機構的OpenAI的報稅記錄必須公開,根據他們當時的稅表可知每年的成本開支都在遞增。2018年是OpenAI作為非盈利機構的最後一個完整年度,當年總開支是5千多萬美元,其中人力成本是1千5百萬美元左右,租用服務器來運行人工智能的模型運算的開支達到3千萬美元,剩下的5百萬美元則包含辦公室租金、差旅費、法律費用等各方面的雜項開支。

2019年OpenAI為吸收投資和給員工分配股權,選擇從非盈利機構轉變為盈利性公司,獲得微軟公司的10億美元投資。而2019年開始的GPT語言模型的研發發佈也開始加速。到2022年底ChatGPT發佈以後,OpenAI的CEO山姆·阿爾特曼承認運行成本過高需要推出收費服務來平衡收支,而微軟公司則立刻增加投資,據說新投資達到100億美元。

簡單總結上面這些信息:

OpenAI在2019年之前的三四年裡燒掉近1億美元,才開始推出最初的GPT模型,當然此時的產品還隻是雛形階段,遠遠達不到今天我們看到的效果。從2019年到2022年由於變成盈利性公司,我們不知道OpenAI的成本支出情況,但是根據CEO山姆·阿爾特曼的發言和融資動作來看,微軟在2019年投入的10億美元恐怕已經大部分花掉。

現在事後諸葛亮的我們當然可以說OpenAI過去7年多燒掉近10億美元做出來的ChatGPT是一個非常成功的投資故事。但是同時期美國成立的人工智能初創企業遠不止OpenAI一個,不少當時比OpenAI更出風頭的類似企業現在已經杳無聲息,燒掉的資本當然更是無法計數。


從財務角度分析,這種未知領域的創新性研發就是一個漫長的燒錢過程,而其成果則具有高度不確定性。因此,就連Google、蘋果和Facebook這樣的明星企業也沒有“燒出”ChatGPT這樣的產品,更不用說從總收入到利潤率都落後於西方同行的中國互聯網大廠。

國內的互聯網企業雖然給我們的感覺是財力雄厚,但是在這種前沿研發的競爭中,它們的本錢比之於國外對手依然薄弱很多。這其實和當下個人創業有些類似,王思聰曾經創業投資熊貓直播和香蕉娛樂這些娛樂公司,後來基本上都血本無歸,但這並不妨礙他現在依舊可以隨手拍出200多萬人民幣來民事和解。而大部分普通的創業人並沒有這麼多的試錯機會,一次失敗可能就會把多年的積蓄都打水漂,很難為一個虛無縹緲的商業目標長期燒錢。

七年前當OpenAI成立的時候,國內互聯網企業還處於剛剛完成起步、全力發展的階段。阿裡巴巴剛剛推出國內第一個“雙十一”購物節,而騰訊的微信支付正在和支付寶進行紅包大戰。後來的國內人工智能領頭企業字節跳動的抖音短視頻平臺還沒有面世。

今天在ChatGPT成功的刺激下,國內互聯網大廠紛紛決定追隨進入這個領域,雖然這種註重確定性、降低試錯成本的跟隨模仿研發戰略說出來很沒面子,但這恐怕也是目前最符合國內大部分企業自身條件的一種理性選擇。

那麼,國內科研機構和大學院系為什麼也沒能夠做出類似的創新成果?

如果我們用論文產出作為衡量人工智能領域水平的標準,那麼中國目前已經達到世界第一。根據斯坦福大學出版的《人工智能指數報告2022》提供的信息,中國研究者目前在AI類的學術刊物和學術會議上發表論文的數量和論文的引用數量都已經達到全球第一,論文發表數量甚至比美國發表數量的兩倍還多。但是,這些論文和引用到底對經濟生產做出多大貢獻呢?


AI學術刊物發表論文數量排名


AI學術刊物論文引用數量排名

根據科技部發佈的《2022年全國技術市場統計年報》,2021年全國高校全年輸出的所有專業的全部技術合同達接近13萬項,成交額為 790.4 億元。而2021年全年國內所有的技術合同的總成交額達到37000多億元,高校科研產出的金額隻占全國所有技術合同金額的2%。人工智能作為一個學科下面的分支研究方向,其技術合同創造價值所占的比重恐怕更是微乎其微。

高校這樣高學歷科研人員最集中的地方,為什麼科研產出比重卻這麼低?

一個很重要的原因就是國內高等院校和科研院所考核研究人員的核心指標就是發表文章的數量和刊物檔次。據媒體報道,全國普通高校專任教師中30-44歲教師占全體教師人數的59.6%。而這些受過最優秀教育、科研能力處於黃金時期的中青年碩士、博士和博士後們,在學校“非升即走”的政策壓力下,將教學之外的全部精力都用在追求“發表文章”這個目標上。

當然,利用論文發表這個指標來考核科研人員也是通行於歐美高校的一個做法,國內說起來也不過是和國外接軌,並在此基礎上“卷”得更厲害一些罷。

但是,我們今天面臨著實實在在的科技“鐵幕”,對於國傢和社會來說,科研人員幫助企業解決幾個具體的工程技術難關比在某些學術刊物上多發表幾篇論文可能價值更大一些。


新華社呼籲破除“唯論文論”(資料圖)

我之前曾經有一篇文章介紹過80-90年代美國半導體行業產學研合作的范例,其中的關鍵就是國傢和企業共同出資,由高校和科研院所提供科研人員承擔具體項目,由企業生產技術骨幹作為評委,來共同解決國內在關鍵領域制造環節面臨的工藝和設備難關。而如果想要撬動國內科研機構中研究潛力最大的這一批中青年研發人員,國傢就必須給予相應的政策激勵。

例如,提升重大產業產學研合作的研發項目的規格,賦予這些項目類似於國傢自然科學基金項目的地位,這樣承接和完成這些產學研合作的研發項目就可以幫助中青年教師完成學校的考核指標,有助於職稱評定和晉升。這會讓國內大量的科研人力資源從比拼論文的內卷中解放出來,轉而投入到補齊產業鏈短板的實際應用科研之中去。

ChatGPT的成功面世在展示給我們無數可能的同時,也給國內提醒。人工智能、量子計算機這些科技創新的發展似乎正在進入一個加速迭代、加速進步的時代,這有些類似於《流浪地球2》中圖恒宇的女兒圖丫丫通過快速迭代迅速成熟的情節。


國內的技術追趕則面臨著雙重難題:一方面要追趕加速前進的技術前沿,另一方面我們的現有短板和被封堵的事實則增加中國追趕的難度。比方說進行人工智能計算所需的高性能AI芯片,國內既無法購買到國外的先進產品,也無法制造自己設計的替代產品。

在此關鍵時刻,提高投資效率,推動產業升級不僅僅需要保證資本投入的高效,更要解放那些處於“內卷”之中的人力資源,讓寶貴的科研力量可以集中起來,解決國傢急需的生產制造難題。


相關推薦

2024-03-25

發表於2017年,到現在被引次數已超過11萬。它不僅是當今ChatGPT為代表的大模型技術起源之一,其中介紹的Transformer架構和註意力機制也被用在Sora、AlphaFold等眾多改變世界的AI技術之中,是當之無愧的傳奇。為什麼是Google能搞出這

2024-07-04

式人工智能專利態勢報告》。根據報告,2014年至2023年,中國發明人申請的生成式人工智能專利數量最多,遠超美國、韓國、日本和印度等國。2014年至2023年間,中國的生成式人工智能發明超過3.8萬件,是排名第二的美國的6倍。

2023-03-20

本友 提問:我今年剛加入學校做助理教授,研究方向與ChatGPT相關。在國外,這些研究都是由相對比較年輕的人來做的,但國內不一樣,很多資源基本都在相對高級別教授或工程師手裡,比如機器、學生,但他們對新技術的理解

2024-02-19

沒有什麼是不可替代的;第二,在問 Sora 為什麼沒出現在中國的同時,可能也得問問假設真的出現(可能很快),我們有沒有準備好?如何能保證知識和創意的通暢準確傳播讓每個人擁有講述和傳播自己故事的“超能力”,做到

2022-06-27

舉行。去年11月,首爾大學研究團隊向CVPR提交瞭一篇學術論文,結果被選為“優秀論文”,本月23日,該成果在與會的全球研究人員面前進行瞭展示。但第二天開始,輿論便出現首爾大學團隊論文抄襲的爭議。視頻網站YouTube上的

2024-03-03

GPT-4的表現接近於人類水平,大大超越以往LLM性能,比如ChatGPT。由此,研究給出關鍵性結論:我們認為它可以被合理地視作一個早期版本(仍不完整)的AGI。在此基礎上,研究團隊還進一步探討真正意義上的AGI應該具備哪些要素

2023-03-18

對我講的設想,在2%的平臺貢獻裡,我們占一點點就行。ChatGPT對我們的機會是什麼?它會把計算撐大,把管道流量撐大,這樣我們的產品就有市場需求。”數學的重要性越來越高任正非認為,拿破侖數學立國的做法,推動法國數

2024-02-29

斯克的回應也是相當的抽象……按理來說,果子作為一個全球市值第二的科技公司,肯定是又有錢又有技術。像華為和小米這樣,入局新能源汽車應該不算太難。但從各方的報道看,蘋果這捏車捏十年,最後還真就是沒捏出來…

2023-03-28

達2小時的對話中透露。不僅如此,奧特曼談及近期圍繞ChatGPT產生的諸多問題,坦承就連OpenAI團隊,也根本沒搞懂它是如何“進化”的:從ChatGPT開始,AI出現推理能力。但沒人能解讀這種能力出現的原因。唯一的途徑是向ChatGPT提

2024-04-08

AI的產品EVI發佈,能夠進行在線交互的Demo也正式公開。與ChatGPT、Claude3等基於文本的聊天機器人不同,EVI為純語音交互,強調通過分析人類言語和聲音,來理解人類用戶最真實的心理狀況。畢竟,在開心、憤怒、失落、困倦時說

2024-03-21

能熱潮中,“轉換器”(Transformer)已成為大語言模型和ChatGPT的核心基石。而這項技術最初源於谷歌的八名員工,他們於2017年12月發佈論文《你所需要的是註意力》。這篇論文如同在人工智能領域引發一場“宇宙大爆炸”,徹底

2023-02-01

作為全新的人工智能(AI)語言模型,ChatGPT誕生於2022年11月30日。目前,雖然其尚處於試運行階段,但已經產生極為震撼的影響。對此,我已在本專欄發表文章《ChatGPT沖擊波已來,高等教育應做好準備》(2023年1月10日第3版),

2024-02-20

天般的難題。Diffusion Model這一局,是徹底輸給Transformer。ChatGPT故事再次重演,Sora其實站在Google的肩膀上讓我們深入扒一扒,Sora是站在哪些前人的肩膀上。簡而言之,最大創新Patch的論文,是Google發表的。Diffusion Transformer的論文

2023-03-28

ChatGPT在全球掀起AI大模型的浪潮。在美國,以OpenAI、Anthropic等初創企業和以微軟、Google為代表的科技巨頭帶領著美國在AI大模型的道路上蒙眼狂奔,最大參數已卷到5620億。在中國,美團王慧文、阿裡賈揚清、前搜狗CEO王小川、前