幫助喪失語言能力的人“開口說話”,定制化數字聲音如此神奇

文/東方亦落

根據英國《衛報》的消息,科學傢發明瞭一種能夠讓喪失語言能力的人重新“說話”的定制化數字聲音技術。

要知道,全球因傷病和先天疾病而喪失語言能力的人有數百萬之多,如失語癥、神經元疾病、腦癱、中風、自閉癥等,都能夠對參與語言表達的肌肉控制能力造成影響。在美國,有超出200萬的人要借助AAC(適應性替代通信)彌補語言方面的缺陷,而在英國,占總人口1%比率的人也都需要這項技術。

說起這方面的技術,我們最容易想到的是斯蒂芬霍金。霍金和外界溝通需要通過紅外線感應器以眨眼速度的變化發出訊息,將其傳至電腦,轉化為英文。電腦需適應霍金的眨眼速度以打出英文單詞,而語言合成器負責轉文字為語音。

由於患有ALS(肌肉萎縮性脊髓側索硬化癥),霍金自21歲起便逐漸喪失瞭全身的機動能力和說話能力。他需要佩戴裝有紅外傳感器的特制眼鏡,用來輔助偵測面部肌肉,實現對電腦的操控。所以即使隻是執行一次搜索,也要花費十分鐘甚至更長時間。

為使霍金對電腦系統的操作能力有所提升,英特爾公司在2014年推出瞭一套全新的輔助語義情境感知工具包,其中包括自動完成窗口瀏覽、文件管理以及任務切換、眼動追蹤、語音合成、聯想輸入等技術,將霍金的電腦操作效率提升瞭10倍。

並且這套說話軟件已經在幾年前向外界開放,用來幫助更多人。而且英特爾對其進行瞭升級,減少打字動作,加入預測性輸入技術,幫助提升打字速度。其中最值得關註的就是“上下文輸入預測”功能。采集和分析瞭大量霍金此前發表的文章和回復,建立獨特的數據模型,據此分析霍金當下最可能的輸入習慣。

但AAC技術推廣以來,卻出現一個問題,就是使用這種技術的人有數百萬,但能夠使用的聲音類型卻相當有限,隻有幾十種選擇,大部分還都是成年人和男性的聲音。而科學傢帕特爾則有效地通過技術的研究解決瞭這個問題。

她和她的團隊成立瞭“語音銀行”。這是一個人們可以通過互聯網儲存自己聲音的在線平臺,每位提供者的聲音都被納入聲音庫中,可以為客戶制作新的聲音。

創建這樣一個數字化語音需要生源和過濾器。聲源像聲紋一般獨一無二,而過濾器則是將這些聲源發出的聲音塑造成不連續的、人耳可辨別的單詞,嘴唇、舌頭、咽喉都起著過濾器的作用。

而聲音應用程序Vocal ID就能夠借助此原理工作。從接受者處捕捉數秒聲源,將其應用到捐贈者提供的過濾器中,再通過算法的調整,就可以提供更多變化的聲音。新聲音的制作完成之後,能夠作為插件添加到擁有者已使用的所有語音設備中,並且用戶能夠自行調整聲音,來獲得期望的音調。

不同的對話技術是能夠根據用戶的需求而改變的,並且這種變化十分顯著。手指肌肉比較發達的人可以使用傳統鍵盤進行文字輸入,通過揚聲器聽到發音。許多用戶更習慣通過操縱桿選擇屏幕中的文字。對於不能使用操縱桿的人,就可以通過眼球和臉部肌肉的運動進行選擇。而要完成這些,ACC設備必不可少。

不過,對於擁有ACC設備的用戶而言,有時會出現令人沮喪的局面。有時在需要選擇字符時,必須等待光標跳過前面的字符。如果錯過瞭最佳時機,則需要等待下一輪的循環。並且不少設備是不具備關於性等隱晦話題的字符的,這使人們無法坦率地與朋友或愛人談論這一話題,這些還有待改進。

本文僅代表作者觀點,不代表百度立場。
本文系作者授權百度百傢發表,未經許可,不得轉載。00

0 個評論

要回覆文章請先登錄註冊