2022年高考英語AI得分134 復旦武大校友這項研究有點意思


在挑戰寫語文作文後,AI現在又盯上瞭高考英語。結果好傢夥,今年高考英語卷(全國甲卷)一上手,就拿瞭134分。而且不是偶然的超常發揮。在2018-2021年的10套真題測試中,AI的分數都在125分以上,最高紀錄為138.5分,聽力和閱讀理解還拿過滿分。

這就是由CMU學者提出的,高考英語測試AI系統Qin

它的參數量隻有GPT-3的16分之一,平均成績卻比GPT-3高出15分。


其背後的秘訣名叫重構預訓練 (reStructured Pre-training),是作者提出的一種新學習范式。

具體來看,就是把維基百科、YouTube等平臺的信息重新提取重構,再喂給AI進行訓練,由此讓AI具有更強的泛化能力。

兩位學者用足足100多頁的論文,深入解釋瞭這一新范式。

那麼,這一范式到底講瞭什麼?

我們來深扒一下~

什麼是重構預訓練?

論文題目很簡單,就叫reStructured Pre-training(重構預訓練,RST)。


核心觀點凝練來說就是一句話,要重視數據啊!

作者認為,這個世界上有價值的信息無處不在,而目前的AI系統並沒有充分利用數據中的信息。

比如像維基百科,Github,裡面包含瞭各種可以供模型學習的信號:實體,關系,文本摘要,文本主題等。這些信號之前由於技術瓶頸都沒有被考慮。

所以,作者在本文中提出瞭一種方法,可以用神經網絡統一地存儲和訪問包含各種類型信息的數據。

他們以信號為單位、結構化地表示數據,這很類似於數據科學裡我們常常將數據構造成表或JSON格式,然後通過專門的語言(如SQL)來檢索所需的信息。


具體來看,這裡的信號,其實就是指數據中的有用信息。

比如在“莫紮特生於薩爾茨堡”這句話中,“莫紮特”、“薩爾茨堡”就是信號。

然後,就需要在各種平臺上挖掘數據、提取信號,作者把這個過程比作瞭從礦山裡尋寶。


接下來,利用prompt方法,就能將這些來自不同地方的信號統一成一種形式。

最後,再將這些重組的數據集成並存儲到語言模型中。

這樣一來,該研究就能從10個數據源中,統一26不同類型的信號,讓模型獲得很強的泛化能力。

結果表明,在多個數據集中,RST-T、RST-A零樣本學習的表現,都優於GPT-3的少樣本學習性能。


而為瞭更進一步測試新方法的表現,作者還想到瞭讓AI做高考題的方法。

他們表示,現在很多工作方法走的都是漢化GPT-3的思路,在評估的應用場景上也是跟隨OpenAI、DeepMind。

比如GLUE測評基準、蛋白質折疊評分等。

基於對當下AI模型發展的觀察,作者認為可以開辟出一條新的賽道試試,所以就想到瞭用高考給AI練練手。

他們找來瞭前後幾年共10套試卷進行標註,請高中老師來進行打分。

像聽力/識圖理解這樣的題目,還找來機器視覺、語音識別領域的學者幫忙。

最終,煉出瞭這套高考英語AI模型,也可以叫她為Qin


從測試結果可以看到,Qin絕對是學霸級別瞭,10套卷子成績都高於T0pp和GPT-3。


此外,作者還提出瞭高考benchmark。

他們覺得當下很多評價基準的任務都很單一,大多沒有實用價值,和人類情況對比也比較困難。

而高考題目既涵蓋瞭各種各樣的知識點,還直接有人類分數來做比對,可以說是一箭雙雕瞭。

NLP的第五范式?

如果從更深層次來看,作者認為,重構預訓練或許會成為NLP的一種新范式,即把預訓練/微調過程視為數據存儲/訪問過程。

此前,作者將NLP的發展總結成瞭4種范式:

P1. 非神經網絡時代的完全監督學習 (Fully Supervised Learning, Non-Neural Network)

P2. 基於神經網絡的完全監督學習 (Fully Supervised Learning, Neural Network)

P3. 預訓練,精調范式 (Pre-train, Fine-tune)

P4. 預訓練,提示,預測范式(Pre-train, Prompt, Predict)


但是基於當下對NLP發展的觀察,他們認為或許之後可以以一種data-centric的方式來看待問題。

也就是,預訓/精調、few-shot/zero-shot等概念的差異化會更加模糊,核心隻關註一個點——

有價值的信息有多少、能利用多少。

此外,他們還提出瞭一個NLP進化假說。

其中的核心思想是,技術發展方向總是順著這樣的——做更少的事實現更好、更通用的系統。

作者認為,NLP經歷瞭特征工程、架構工程、目標工程、提示工程,當下正在朝著數據工程方向發展。


復旦武大校友打造

本篇論文的一作為Weizhe Yuan

她本科畢業於武漢大學,後赴卡內基梅隆大學讀研,學習數據科學專業。

研究方向集中在NLP任務的文本生成和評估。

去年,她被AAAI 2022、NeurIPS 2021分別接收瞭一篇論文,還獲得瞭ACL 2021 Best Demo Paper Award。


論文的通訊作者為卡內基梅隆大學語言技術研究所(LTI)的博士後研究員劉鵬飛

他於2019年在復旦大學計算機系獲得博士學位,師從邱錫鵬教授、黃萱菁教授。

研究興趣包括NLP模型可解釋性、遷移學習、任務學習等。

博士期間,他包攬瞭各種計算機領域的獎學金,包括IBM博士獎學金、微軟學者獎學金、騰訊人工智能獎學金、百度獎學金。


One More Thing

值得一提的是,劉鵬飛在和我們介紹這項工作時,直言“最初我們就沒打算拿去投稿”。

這是因為他們不想讓會議論文的格式限制瞭構思論文的想象力。

我們決定把這篇論文當作一個故事來講,並給“讀者”一種看電影的體驗。

這也是為什麼我們在第三頁,設置瞭一個“觀影模式“的全景圖。

就是為瞭帶著大傢去瞭解NLP發展的歷史,以及我們所展望的未來是怎樣的,讓每一個研究者都能有一定的代入感,感受到自己去帶領著預訓練語言模型們(PLMs)通過礦山尋寶走向更好明天的一個過程。


論文結尾,還藏瞭一些驚喜彩蛋。

比如PLMs主題表情包:


還有結尾的插畫:


這麼看,100多頁的論文讀起來也不會累瞭


相關推薦

2023-11-29

漢大學捐贈13億現金。在捐贈儀式上,他表示將用於支持武大的基礎學科發展、科技創新和大學生培養。雷軍表示,30多年前在武大讀書時有兩個願望,第一個願望:30多年前作為優秀學生代表被授予當時武大最高的獎學金,兩千

2024-03-27

學院辦公室工作人員對於雷軍班的消息回復稱:“在今年高考後,雷軍班將向全國招15名本科生,屬於計算機專業,吸納最優秀的有志向的學生就讀,本博貫通培養。”他介紹,雷軍班其他普通本科班相比不一樣,整個培養方面

2023-08-28

武漢大學官方透露,在武漢大學即將迎來130歲生日之際,武大校友雷軍宣佈將獎學金再翻倍升級到2000萬元,用於激勵拔尖創新人才培養。今年6月,雷軍捐資9999.9999萬元興建的武漢大學科技樓已正式交付。據悉,雷軍於2012年向武

2022-06-30

Parti 都取得瞭最先進的結果。尤其在 MS-COCO 零樣本的 FID 得分僅為 7.23,微調 FID 得分為 3.22,超過瞭此前的 Imagen 和 DALL-E 2。所有組件都是 Transformer時隔一個月,谷歌再把 AI 作畫卷出新高度,結果作者卻說:秘訣很簡單。Parti 主

2024-04-19

的是,就在林斌夫婦此次像中山大學進行捐贈之前,身為武大1987級計算機系校友的雷軍,也曾向母校進行巨額捐贈。去年11月,武大百卅校慶之日,雷軍個人向母校捐贈13億元人民幣,這筆捐贈不僅刷新武大建校以來單筆最大捐

2023-11-29

雷軍個人向母校捐贈13億元人民幣。據解,該筆捐贈刷新武大建校以來單筆最大捐贈額。這也是全國高校收到的最大一筆校友個人現金捐贈。雷軍表示,此次捐贈主要聚焦三個方向:支持數理化文史哲六大學科基礎研究、支持計

2023-03-15

57個主題、14000個多項選擇題翻譯成多種語言。在測試的英語、拉脫維亞語、威爾士語和斯瓦希裡語等26種語言中,有24種語言下,GPT-4優於GPT-3.5 和其他大語言模型(Chinchilla、PaLM)的英語語言性能。而在TruthfulQA等外部基準測試方

2023-11-30

也是全國高校收到的最大一筆校友個人現金捐贈。雷軍在武大第九屆校友珞珈論壇上,作為演講嘉賓進行分享講話。他表示,對自己而言,能夠回母校捐款,是最值得做的幾件事情之一。雷軍這次捐贈主要聚焦三個方向:支持數

2023-05-11

模型在“以人為本”(human-centric)的標準化考試中,如高考、公務員考試、法學院入學考試、數學競賽和律師資格考試中的表現。論文鏈接:https://arxiv.org/pdf/2304.06364.pdf數據鏈接:https://github.com/microsoft/AGIEval研究人員使用AGIEval

2023-06-20

禮,並特別邀請2020屆畢業生回校參加線下的畢業儀式,武大傑出校友、小米科技有限責任公司的董事長兼CEO雷軍也出席活動並發表演講。雷軍向武大學子寄語,不管何時何地,不管遭遇什麼,都要永遠堅持自信。 雷軍還幽默地

2022-10-23

格爾、愛因斯坦的研究成果。這位學者來自浙江大學,在復旦、杭州大學都有過任教經歷。她的丈夫、兒子都是中科院院士,和她同期在浙大求學的同門中,也不乏院士、教授級人物。但朱良璧直到退休時,職稱都還是講師,主

2022-10-02

開頭說的這位有點“倒黴”的博士生,中國科學技術大學校友杜德濤。那麼,當年的那場意外,究竟為杜德濤和飛秒手術帶來什麼?博士生眼球意外成測試樣本此前,杜德濤在飛秒LASIK上的貢獻鮮為人知。一切要從1993年說起。那

2023-06-20

度,更是空前的難度。”雷軍表示,他的每次決定,都是武大給的勇氣,在武大的幾年教會他學習能力比知識更重要,雷軍鼓勵武大學子,無論什麼時候,無論經歷什麼,都要永遠保持自信。在演講中,雷軍稱,在武大時學的是

2023-03-14

出生於江蘇徐州的吳幽是一個90後。2017年,吳幽成為萬千高考學子中的一員,但吳幽當年的成績連二本線都沒能夠到。僅靠文化課不能實現自己大學夢的吳幽,最終通過相聲特長成功邁入中國礦業大學的校門,成為該校礦物加工