首頁>要聞>沸點 沸點
能讀懂你心里話的AI來了,識別錯誤率低至3%
本報記者 劉園園
最近,美國加州大學舊金山分校的科研團隊使用人工智能解碼系統(tǒng),把人的腦電波轉(zhuǎn)譯成英文句子,最低平均錯誤率只有3%。這項研究發(fā)表在《自然·神經(jīng)科學》雜志上。
參加實驗的4名志愿者都是癲癇患者,他們由于治療需要在大腦表面植入了數(shù)百個微電極。研究人員正是利用這些微電極陣列來記錄其腦電波信號,然后借助人工智能系統(tǒng)進行解碼。
正確率勝過人工速記員
論文顯示,10年前,科學家首次從人類大腦信號中解碼出語音,但是解碼的精度和速度遠低于自然語速。
低到什么程度呢?
研究團隊介紹,迄今為止,在直接從腦電波中解碼語音的研究中,腦機接口系統(tǒng)僅限于解碼單音節(jié),或在志愿者連續(xù)念出約100個單詞的情況下,只能正確解碼不到40%的單詞。
為提升解碼精確度,研究團隊從機器翻譯中獲得啟發(fā),訓(xùn)練了一種循環(huán)神經(jīng)網(wǎng)絡(luò)。研究中,4名志愿者被要求大聲重復(fù)朗讀30至50句話。他們大腦外側(cè)皮質(zhì)上分布著大量微電極,可以監(jiān)測到相應(yīng)的大腦神經(jīng)活動。這些腦電波數(shù)據(jù)輸入人工智能系統(tǒng)后,先被編碼成一串序列,然后解碼成相應(yīng)的英文句子。
研究人員表示,這項研究展示了以高精度和自然語速來解碼皮層腦電圖。在對其中一個志愿者的腦電波解碼任務(wù)中,平均每句話只有3%需要糾正——低于專業(yè)人工速記員平均5%的錯誤率。
但研究團隊也強調(diào),該研究涉及的句子量比較少。“如果你嘗試不使用這50個句子的數(shù)據(jù)集,解碼就會糟糕很多。”論文第一作者約瑟夫·馬金接受媒體采訪時說。
展示AI解讀神經(jīng)信號的潛力
“這項研究的創(chuàng)新之處在于,采用端到端的深度學習網(wǎng)絡(luò)實現(xiàn)神經(jīng)信號翻譯,從工程角度展示了人工智能技術(shù)應(yīng)用于神經(jīng)信號解讀的潛力。”清華大學醫(yī)學院神經(jīng)工程實驗室、清華大學人工智能研究院教授洪波在接受科技日報記者采訪時評價說。
洪波分析,這項研究的難點在于兩個方面。
首先是采用了高密度微電極陣列,間距4毫米,多達256個電極,覆蓋大腦皮層表面的關(guān)鍵腦區(qū),獲取了足夠的神經(jīng)信息用于解碼。這種電極在國內(nèi)尚沒有可用于臨床的產(chǎn)品。
另外,研究中深度循環(huán)神經(jīng)網(wǎng)絡(luò)的訓(xùn)練,除了采用時間軸上的卷積操作提高特征提取能力,還把語音頻譜特征也作為訓(xùn)練目標,大大降低了對神經(jīng)數(shù)據(jù)量的需求。
“腦機接口的一個核心難題是神經(jīng)信息的解碼和翻譯,腦電信號噪聲大,背后的神經(jīng)編碼機制復(fù)雜未知,這些都是挑戰(zhàn)。”洪波認為,以深度學習為代表的人工智能技術(shù)發(fā)展,為腦機接口打開一條應(yīng)對該挑戰(zhàn)的新路徑。
不過,在洪波看來,人工智能與腦機接口結(jié)合,也帶來新難題:如何獲得大量的訓(xùn)練數(shù)據(jù)?來自人腦的高精度神經(jīng)數(shù)據(jù)通常只在臨床條件下才能獲得,這會使神經(jīng)網(wǎng)絡(luò)訓(xùn)練陷入困境。
現(xiàn)實應(yīng)用仍存技術(shù)障礙
“這項技術(shù)目前主要用于癲癇外科的臨床,幫助外科醫(yī)生在切除癲癇病灶之前,確定關(guān)鍵的語言功能區(qū)。要讓漸凍人、高位截癱等殘疾患者用上這樣的腦機接口,還要繼續(xù)解決長效電極和解碼效率的問題。”洪波說。
他認為,相關(guān)技術(shù)在未來實際應(yīng)用中,仍然有很大的技術(shù)障礙,例如高密度的微電極陣列目前還無法長期植入,難以作為未來腦機接口的標準電極。
洪波團隊也在和材料、微電子以及臨床團隊合作,開發(fā)可以長期植入的微創(chuàng)解決方案。他告訴記者,根本上說,人工智能應(yīng)用于腦機接口,關(guān)鍵門檻還是長期可靠的神經(jīng)電極和清晰準確的神經(jīng)解碼規(guī)律。
“人們所期待的戴上腦電帽就能讀出心里話,從科學和工程角度來看還有很遠的距離。但腦科學和人工智能技術(shù)的結(jié)合,有可能加速這些探索和研發(fā)的進程。”洪波說。
編輯:李澤杰
關(guān)鍵詞:解碼 研究 神經(jīng)