意念打字破新紀錄心中想著“說話”詞就蹦躂出來斯坦福團隊出品

2023-02-01 來自量子位發表於業界精選

意念打字新紀錄誕生！受試者通過植入設備，平均輸入速度能達每分鐘62個單詞，是團隊之前紀錄的3倍。同時準確率也有明顯提升，面向50個單詞詞匯表，識別準確率比先前紀錄提升2.7倍。據研究者稱，這已開始接近正常人溝通速度（每分鐘160個單詞）。

不信？那就看看現場實況。

受試者“按詞輸入”，點點頭就出個句子，還是蠻絲滑的：

相比下，此前研究按“字母”逐個輸入，顯得更費勁不少：

△

2021 年登 Nature 封面的成果展示

創造該紀錄的團隊來自斯坦福，前兩天，他們剛將相關論文預印本放上 bioRXiv，引來不小關註。

未參與項目的加州大學舊金山分校研究員 Philip Sabes，將之稱為“重大突破”。他認為，相關技術很快將走出實驗室，進入落地階段。

不少網友也對該成果也相當興奮，Reddit 點贊上萬，有人恨不能立馬給傢人整一套。

值得一提的是，論文發表同一天，共同主要作者之一的 Krishna Shenoy 因胰腺癌去世，不少學者與研究機構為此悼念。

所以這回，科學傢們如何創造出意念打字新紀錄？與之前方式有什麼不同？

繼續往下看。

識別開口說話的神經活動情況

意念打字過去一直是腦科學領域的熱門研究方向，也備受社會大眾關註，更早之前的實現方法是 —— 讓受試者在腦中手寫字母，或是在腦中讀出特定讀音，再靠系統識別。

此次，科學傢們用不同的信息識別辦法 —— 直接讓受試者“說”出來，哪怕隻在大腦裡。

具體來說，他們依靠一套語音腦機接口（BCI）系統，識別人類說話中相關的口腔、面部神經活動情況，通過解碼其動作控制信號，再去輸出受試者想表達的文本。

基於上述思路，科學傢們開展一系列實驗。

此番受試者是一位女性，時年 67 歲，她在 57 歲時被診斷出患有肌萎縮性側索硬化癥 (ALS)，該病癥讓她在很長時間被吐字發音不清折磨，說話僅能發出幾個元音，輔音幾乎很難分辨。

為保護隱私，該受試者被團隊稱為 T12，2021 年的研究中，他們也用同樣方法，將另一位男性受試者稱為 T5。

2022 年 3 月，經當事人同意，科學傢為其在腦中植入四個微電極陣列，以檢測語言相關神經活動情況。

在植入後的實驗中，科學傢先讓受試者嘗試做不同動作，觀察相關區域的神經活動狀況。

比如，讓受試者睜眼、閉眼、眨眼以觀察控制眼皮相關神經元活動；再比如讓嘴唇張開、閉合、微笑，以檢測相關腦區活動。當然，實驗觀察部位還包括：額頭、下巴、喉部、舌頭等。

科研團隊發現，不同動作之間神經活動高度分離，在特定檢測頻率下，他們針對 34 個口部面部動作進行解碼，準確率為 92.7%，若面向 39 個音素，解碼準確率為 60%。這側面說明原計劃具備可操作性。

下一步是將說話的相關神經活動和文本關聯起來。

科研工作者預先準備一個 RNN 解碼器，以 80ms 為間隔，檢測識別神經活動信號，這當中，神經網絡會依靠最大概率判斷輸出單詞，錯誤的發音也將被糾正，最終輸出文本。

為訓練該網絡，受試者需要每天嘗試輸出 260-280 語句的數據。

百天之後的測試中，無論是否發出聲音，對單詞的識別速度均在每分鐘 50 詞以上，該表現大約是該團隊此前 2021 年紀錄的 3 倍。

且無論面向 50 個單詞，還是 12500 個單詞，解碼效率差異不大。

識別錯誤率也有大幅改善。

針對 50 個單詞的表達，識別錯誤率在 9.1%，即便受試者進行不發聲表達，錯誤率也僅 11.2%。

針對 12500 單詞庫時，表達識別的錯誤率為 23.8%，不發聲輸出錯誤率為 24.7%，該錯誤率與之前研究面向 50 詞的測試情況正誤情況基本持平，能看出該方法準確度大幅上升。

上述測試之外，科學傢還探究哪些方向能進一步優化該系統。

他們考慮三個維度 —— 語言模型詞匯量、植入腦部電極數量、訓練數據集大小。

結果顯示，隨著單詞數量提高，錯誤率的確會升高，但在 1000 詞量級趨於平緩（下方左圖），團隊由此認為，日後研究通過壓縮單詞數不一定有效。

但對於植入電極數量來說，更多的通道數（精度）的確會帶來錯誤率降低。如下方右圖，從 500 提升到 1000，錯誤率從 4%，降低到 1.9%。

另值得一提的是，即便未經訓練，面向新數據，系統單詞錯誤率也隻有 30%。且通過訓練，錯誤率會不斷下降。

對於後續研究，團隊指出該成果目前還不是完整的、臨床上可落地的系統。此外，24% 錯誤率在日常生活中也還不夠低，後續研究將在各方面努力。

意念打字一直熱度不減

本文一作是 Francis Willett，來自斯坦福霍華德休斯醫學研究所，主要研究領域為腦機接口、運動神經科學，他也對人工神經網絡模型有所涉獵。

2021 年登上 Nature 封面的意念打字研究中，他也是一作。跟上次一樣，此番他表示 —— 將會公佈研究的代碼和數據。

另一位主要作者是 Erin Kunz，來自斯坦福電氣工程系在讀博士，此前，她還曾在通用擔任自動駕駛工程師。

前文提及剛剛過世的 Krishna Shenoy 也是本文主要作者。

2021 年登 Nature 的論文，他亦是貢獻者之一，此前研究中，他破譯與手寫筆記相關的大腦信號，讓截癱患者快速準確地打字。

該項工作十分關鍵，因為當時他們使用的方法是 —— 讓受試者在腦中“寫出”字母。

除該團隊，在“意念打字”這件事上，還有更多科學傢在努力。

比如 2022 年 11 月，加利福尼亞大學舊金山分校（UCSF）提出的一種不同方法。他們通過植入 128 通道皮質電圖（ECoG）陣列，外加一個經皮連接器，用來連接植入設備和外部系統。

在識別方式上，他們所想到的是 —— 讓受試者在腦中默念字母 NATO 代碼（比如 α 代替 a，β 代替 b），完成逐個字母輸入，平均 2 秒可鍵入一個字母，最終平均字符錯誤率僅 6.13%。

之前，量子位智庫對該趨勢也有所展望，認為“意念打字”乃至背後的腦機接口技術已在商業化發展上初具雛形。

清華李路明團隊、瑞金醫院、浙江大學及浙大二院神經外科等團隊或機構，均有所積累。

另值得一提的是，去年末馬斯克及 Neuralink 還讓猴子搞一回“意念打字”，雖說是用訓練猴子意念點擊屏幕中的黃色按鈕，但也算“蹭”一波。

當時，馬斯克還說，他和 Neuralink 已向 FDA 遞交諸多文件，預計 6 個月後（預計今年六月）開啟人體試驗。

但能不能等到，還真不一定……

畢竟同樣的話，他在 2022 年 4 月已說過一次。（狗頭）

參考鏈接：

[1]https://www.technologyreview.com/2023/01/24/1067226/an-als-patient-set-a-record-for-communicating-via-a-brain-implant-62-words-per-minute/

[2]https://www.freethink.com/hard-tech/speech-bcis

[3]https://www.biorxiv.org/content/biorxiv/early/2023/01/21/2023.01.21.524489.full.pdf

意念打字破新紀錄心中想著“說話”詞就蹦躂出來斯坦福團隊出品

相關推薦

中國航天又破新紀錄！西昌發射場最短時間實現200次發射

中國腦機接口新突破！清華大學團隊實現高位截癱患者腦控光標

馬斯克官宣首個Neuralink腦機接口人類全民機器人時代來？

EV百公裡加速時間迎來新紀錄：1.5秒

華為在120公裡光纖上實現157Tbit/s傳輸新紀錄

“模特不能太漂亮”，這傢新店賣基礎款服裝年銷千萬

科學傢創下單個光子芯片上的1.84 PB/s光纖數據傳輸速率新紀錄

新紀錄！馬斯科身價破2.5萬億坐穩藍星首富遙遙領先第二名

試這個被刷屏的視頻AI 我感覺自己被詐騙……

馬斯克公司盲視技術已在猴子身上見效：有望讓盲人重見光明

GPT-4老板：AI可能會殺死人類已經出現我們無法解釋的推理能力

7歲女孩不到1秒破世界紀錄：成為華容道新紀錄保持者

畝產1251.5公斤！袁隆平“超級稻”創世界新紀錄

高溫天氣致重慶51條河流斷流周末或將創45℃新紀錄

意念打字破新紀錄 心中想著“說話”詞就蹦躂出來 斯坦福團隊出品

相關推薦

意念打字破新紀錄心中想著“說話”詞就蹦躂出來斯坦福團隊出品