最近幾個月世界上最大的科技新聞恐怕就是ChatGPT的火爆流行。ChatGPT是美國一個初創科技公司OpenAI開發的人工智能應用程序,2022年11月面向公眾開放,到今年1月已經積累1億用戶。
我也是這1億用戶中的一員。這段時間我使用ChatGPT的感受是,如果是在我本專業的經濟和金融搜索方面,我不會依賴它。由於我知道自己所需的大部分經濟和金融數據的原始來源在哪裡,我會直接去各個數據的發佈網站進行尋找。ChatGPT可能更方便,但是由於我的工作要求數據的準確性,所以略過人工智能這個中間層級反而更有效率。
但是在專業以外的地方,尤其是完全陌生的知識領域裡,ChatGPT是一個非常有用的輔助工具。就像我們平時身邊或則網上認識的某些“萬事通”朋友,他們說的不一定就是最正確的權威意見,但的確可以快速給出一個我們容易理解、方便進一步深入解事物的答案。
當然,如果僅僅是搜索輔助這樣的功能,那麼ChatGPT可能也就是一個更加智能的維基百科,並不值得現在這樣熱火朝天的關註度。它在搜索以外的各種場景應用,更是大傢關心的焦點。
就我個人來說,ChatGPT可能對我最大的幫助就是輔助處理各種初級任務。在工作中,我經常需要分析大量數據來尋找規律、分辨趨勢和研究各種異常的變化。但在將自己的研究結論整理成文字的時候,實際上大量的工作時間是用來完成一些初級的數據分析和文字工作,在做真正的深層數據挖掘之前,往往需要完成描述原始數據、畫圖做表、對圖表進行簡單描述等等繁瑣步驟。
當微軟宣佈將ChatGPT整合到自己的辦公軟件後,未來我可以將原始的經濟金融數據“一鍵生成”一份包含圖表和文字介紹的初稿。這個初稿裡隻要能完整、準確的描述原始數據和介紹圖表,那麼我就可以擺脫繁瑣的初級勞動,將主要的時間花在挖掘數據背後的故事、尋找數據變化帶來的機會和風險這樣真正核心的任務上。而當我完成一篇完整的分析之後,ChatGPT甚至可能“一鍵生成”一份精美的PPT,這樣工作效率當然就會成倍的提高。
現實中我們很多人都面對著大量繁瑣的文字工作,如果以後ChatGPT或者類似的人工智能軟件可以讓人“一鍵生成”這些文件,這對於工作效率的提高以及衍生出來的巨大商機的確難以想象。
我相信最近無數人都在思考著人工智能可能在自己的領域造成什麼樣的變化,而也有很多人在提問:為什麼ChatGPT這樣的技術成果沒有出現在中國?
ChatGPT的開發者OpenAI成立於2015年12月,最初是一個非盈利機構,在2019年轉變為盈利性公司。其主要創始人包括現任CEO山姆·阿爾特曼(Sam Altman)以及特斯拉的創始人馬斯克。按照後來的媒體報道,OpenAI的創始者本身就是美國科技領域的明星巨頭,所以他們出面聘請當時美國在人工智能方面最頂尖的一些技術專傢加入,而不少技術專傢因為可以和自己同水平的研究者合作機會難得,寧願降薪加入。
從2016年到2019年,作為非盈利機構的OpenAI的報稅記錄必須公開,根據他們當時的稅表可知每年的成本開支都在遞增。2018年是OpenAI作為非盈利機構的最後一個完整年度,當年總開支是5千多萬美元,其中人力成本是1千5百萬美元左右,租用服務器來運行人工智能的模型運算的開支達到3千萬美元,剩下的5百萬美元則包含辦公室租金、差旅費、法律費用等各方面的雜項開支。
2019年OpenAI為吸收投資和給員工分配股權,選擇從非盈利機構轉變為盈利性公司,獲得微軟公司的10億美元投資。而2019年開始的GPT語言模型的研發發佈也開始加速。到2022年底ChatGPT發佈以後,OpenAI的CEO山姆·阿爾特曼承認運行成本過高需要推出收費服務來平衡收支,而微軟公司則立刻增加投資,據說新投資達到100億美元。
簡單總結上面這些信息:
OpenAI在2019年之前的三四年裡燒掉近1億美元,才開始推出最初的GPT模型,當然此時的產品還隻是雛形階段,遠遠達不到今天我們看到的效果。從2019年到2022年由於變成盈利性公司,我們不知道OpenAI的成本支出情況,但是根據CEO山姆·阿爾特曼的發言和融資動作來看,微軟在2019年投入的10億美元恐怕已經大部分花掉。
現在事後諸葛亮的我們當然可以說OpenAI過去7年多燒掉近10億美元做出來的ChatGPT是一個非常成功的投資故事。但是同時期美國成立的人工智能初創企業遠不止OpenAI一個,不少當時比OpenAI更出風頭的類似企業現在已經杳無聲息,燒掉的資本當然更是無法計數。
從財務角度分析,這種未知領域的創新性研發就是一個漫長的燒錢過程,而其成果則具有高度不確定性。因此,就連Google、蘋果和Facebook這樣的明星企業也沒有“燒出”ChatGPT這樣的產品,更不用說從總收入到利潤率都落後於西方同行的中國互聯網大廠。
國內的互聯網企業雖然給我們的感覺是財力雄厚,但是在這種前沿研發的競爭中,它們的本錢比之於國外對手依然薄弱很多。這其實和當下個人創業有些類似,王思聰曾經創業投資熊貓直播和香蕉娛樂這些娛樂公司,後來基本上都血本無歸,但這並不妨礙他現在依舊可以隨手拍出200多萬人民幣來民事和解。而大部分普通的創業人並沒有這麼多的試錯機會,一次失敗可能就會把多年的積蓄都打水漂,很難為一個虛無縹緲的商業目標長期燒錢。
七年前當OpenAI成立的時候,國內互聯網企業還處於剛剛完成起步、全力發展的階段。阿裡巴巴剛剛推出國內第一個“雙十一”購物節,而騰訊的微信支付正在和支付寶進行紅包大戰。後來的國內人工智能領頭企業字節跳動的抖音短視頻平臺還沒有面世。
今天在ChatGPT成功的刺激下,國內互聯網大廠紛紛決定追隨進入這個領域,雖然這種註重確定性、降低試錯成本的跟隨模仿研發戰略說出來很沒面子,但這恐怕也是目前最符合國內大部分企業自身條件的一種理性選擇。
那麼,國內科研機構和大學院系為什麼也沒能夠做出類似的創新成果?
如果我們用論文產出作為衡量人工智能領域水平的標準,那麼中國目前已經達到世界第一。根據斯坦福大學出版的《人工智能指數報告2022》提供的信息,中國研究者目前在AI類的學術刊物和學術會議上發表論文的數量和論文的引用數量都已經達到全球第一,論文發表數量甚至比美國發表數量的兩倍還多。但是,這些論文和引用到底對經濟生產做出多大貢獻呢?
AI學術刊物發表論文數量排名
AI學術刊物論文引用數量排名
根據科技部發佈的《2022年全國技術市場統計年報》,2021年全國高校全年輸出的所有專業的全部技術合同達接近13萬項,成交額為 790.4 億元。而2021年全年國內所有的技術合同的總成交額達到37000多億元,高校科研產出的金額隻占全國所有技術合同金額的2%。人工智能作為一個學科下面的分支研究方向,其技術合同創造價值所占的比重恐怕更是微乎其微。
高校這樣高學歷科研人員最集中的地方,為什麼科研產出比重卻這麼低?
一個很重要的原因就是國內高等院校和科研院所考核研究人員的核心指標就是發表文章的數量和刊物檔次。據媒體報道,全國普通高校專任教師中30-44歲教師占全體教師人數的59.6%。而這些受過最優秀教育、科研能力處於黃金時期的中青年碩士、博士和博士後們,在學校“非升即走”的政策壓力下,將教學之外的全部精力都用在追求“發表文章”這個目標上。
當然,利用論文發表這個指標來考核科研人員也是通行於歐美高校的一個做法,國內說起來也不過是和國外接軌,並在此基礎上“卷”得更厲害一些罷。
但是,我們今天面臨著實實在在的科技“鐵幕”,對於國傢和社會來說,科研人員幫助企業解決幾個具體的工程技術難關比在某些學術刊物上多發表幾篇論文可能價值更大一些。
新華社呼籲破除“唯論文論”(資料圖)
我之前曾經有一篇文章介紹過80-90年代美國半導體行業產學研合作的范例,其中的關鍵就是國傢和企業共同出資,由高校和科研院所提供科研人員承擔具體項目,由企業生產技術骨幹作為評委,來共同解決國內在關鍵領域制造環節面臨的工藝和設備難關。而如果想要撬動國內科研機構中研究潛力最大的這一批中青年研發人員,國傢就必須給予相應的政策激勵。
例如,提升重大產業產學研合作的研發項目的規格,賦予這些項目類似於國傢自然科學基金項目的地位,這樣承接和完成這些產學研合作的研發項目就可以幫助中青年教師完成學校的考核指標,有助於職稱評定和晉升。這會讓國內大量的科研人力資源從比拼論文的內卷中解放出來,轉而投入到補齊產業鏈短板的實際應用科研之中去。
ChatGPT的成功面世在展示給我們無數可能的同時,也給國內提醒。人工智能、量子計算機這些科技創新的發展似乎正在進入一個加速迭代、加速進步的時代,這有些類似於《流浪地球2》中圖恒宇的女兒圖丫丫通過快速迭代迅速成熟的情節。
國內的技術追趕則面臨著雙重難題:一方面要追趕加速前進的技術前沿,另一方面我們的現有短板和被封堵的事實則增加中國追趕的難度。比方說進行人工智能計算所需的高性能AI芯片,國內既無法購買到國外的先進產品,也無法制造自己設計的替代產品。
在此關鍵時刻,提高投資效率,推動產業升級不僅僅需要保證資本投入的高效,更要解放那些處於“內卷”之中的人力資源,讓寶貴的科研力量可以集中起來,解決國傢急需的生產制造難題。