首頁(yè) 資訊 > 創(chuàng)新 > 正文

植入物結(jié)合AI將大腦信號(hào)轉(zhuǎn)為語(yǔ)音


(資料圖)

科技日?qǐng)?bào)北京8月29日電 (記者劉霞)荷蘭拉德堡德大學(xué)和烏得勒支大學(xué)科學(xué)家成功將人類的大腦信號(hào)轉(zhuǎn)化為人們能聽(tīng)得見(jiàn)的語(yǔ)音。借助植入物和人工智能解碼來(lái)自大腦的信號(hào),他們能夠預(yù)測(cè)用戶想說(shuō)的話,準(zhǔn)確率為92%至100%。研究人員希望這項(xiàng)技術(shù)能夠幫助癱瘓且無(wú)法溝通的患者再次“發(fā)聲”。相關(guān)論文發(fā)表于最新一期《神經(jīng)工程雜志》。

拉德堡德大學(xué)科研團(tuán)隊(duì)請(qǐng)臨時(shí)植入大腦植入物的非癱瘓用戶在測(cè)量大腦活動(dòng)時(shí)大聲說(shuō)出一些單詞,借助這一方法,他們?cè)诖竽X活動(dòng)和語(yǔ)音之間建立了直接的映射關(guān)系,隨后,使用先進(jìn)的人工智能模型將大腦活動(dòng)直接轉(zhuǎn)化為聽(tīng)得見(jiàn)的語(yǔ)音。這意味著他們不僅能猜測(cè)用戶在說(shuō)什么,而且還可立即將這些單詞轉(zhuǎn)化為可理解的聲音。更重要的是,重建后的語(yǔ)音在語(yǔ)調(diào)和說(shuō)話方式上甚至聽(tīng)起來(lái)像癱瘓人士發(fā)出來(lái)的。

在最新研究中,研究人員用相對(duì)較小的數(shù)據(jù)集重建可理解的語(yǔ)音,表明模型可用有限的數(shù)據(jù)揭示大腦活動(dòng)和語(yǔ)音之間的復(fù)雜映射關(guān)系。他們還對(duì)志愿者進(jìn)行了聽(tīng)力測(cè)試,以評(píng)估合成單詞的可識(shí)別性。結(jié)果表明,這項(xiàng)技術(shù)不僅正確識(shí)別出了單詞,準(zhǔn)確率高達(dá)92%到100%,還讓這些單詞像真實(shí)的聲音一樣被聽(tīng)得見(jiàn)和理解。

不過(guò),研究人員強(qiáng)調(diào),最新技術(shù)仍有一些局限性。他們的目標(biāo)是僅根據(jù)人們的大腦活動(dòng)來(lái)預(yù)測(cè)他們想說(shuō)的完整句子和段落。要實(shí)現(xiàn)這一目標(biāo),還需要開(kāi)展更多實(shí)驗(yàn),研制出更先進(jìn)的植入物,采集更大的數(shù)據(jù)集,創(chuàng)建更先進(jìn)的人工智能模型。

關(guān)鍵詞:

最近更新

關(guān)于本站 管理團(tuán)隊(duì) 版權(quán)申明 網(wǎng)站地圖 聯(lián)系合作 招聘信息

Copyright © 2005-2023 創(chuàng)投網(wǎng) - www.mallikadua.com All rights reserved
聯(lián)系我們:39 60 29 14 2@qq.com
皖I(lǐng)CP備2022009963號(hào)-3