????杜克進入一種入魔一樣的研究狀態(tài),他現(xiàn)的時間非常寶貴,完全沒有多少可以浪費的空間,所以吃完后就迅速回到自己那個小小的家里。坐24小時不間斷下載的電腦面前,他瘋狂下載各種語音片段資料,交給克里進行語音語義分析及基礎(chǔ)知識庫的建設。
????自從搬到出租屋后杜克已經(jīng)瘋狂網(wǎng)上下載了數(shù)千各種環(huán)境和語境下的語音片段,從電視電臺聞片段到影視劇對白、動物世界或是國家地理頻道的科教解說片段,以及各種偷拍、自拍、偽自拍生活現(xiàn)場片段,感謝酷溜土豆、yutub,還有bt和電驢,讓杜克知道原來世界還有如此豐富多彩聲音。
????杜克收集的如此眾多聲音材對于克里處理能力來說卻仿佛是滄海一粟,往往剛剛輸入進去,克里就運算解析出來該片段的語音語義特征,從而為語音識別的語音語義特征庫增加一份的標本元素,越是不同的語音片段越有價值。
????這就像一個人生活過的地方越多,就越能聽出不同地方口音是一個道理,每個聲音都是有一些特殊特征和普遍特征構(gòu)成的,現(xiàn)的語音識別軟件對于標準音的識別率其實已經(jīng)很不錯了。
????如ib很多年前就推出語音識別輸入系統(tǒng)iai,安靜環(huán)境和標準音情況下軟件識別率可以達到實用級別。
????可惜實際運用環(huán)境不會那么理想,而是就像杜克寢室4個人一樣千差萬別,雖然大家說的都是國話,但是四個來自不同地方的人的口音卻大相徑庭,剛剛住一起的時候四個人溝通經(jīng)常有些問題,但是大家很快就適應下來。
????人腦強悍的學習能力絕對不是當今電腦所能夠比擬的。而現(xiàn)有的語音識別軟件卻沒有這么強悍的學習適應能力,也就是說它沒有用來識別這種語音特征差異的知識庫,當然就無法將一些未知類型的音很好的識別出來。
????不同口音的識別和環(huán)境噪音的排除是語音識別倆個難題,要解決這些問題需要大量的第一手語音資料片段來建立一個海量的語音特征知識庫,或者是開出像克里這般高智能的超級電腦。
????克里根據(jù)杜克下載的理論資料,結(jié)合各種語音片段分析,不斷對語音識別基礎(chǔ)算法進行了,并且生成不同的語音識別模擬器--這是主要考慮到地球現(xiàn)主流電腦的運算水平比起克里來說實太低級。
????以模擬iphn4的50%運算能力為低基準,克里模擬出不同性能情況下該語音識別算法的準確率和反應時間,原始版本從初基準性能下5秒內(nèi)能夠達到90%的識別準確率--當然這個成績已經(jīng)遠超現(xiàn)地球上所有語音識別軟件水準。
????要知道這個90%準確率是用數(shù)千段不同語境的不同口音英語音信息進行模擬識別檢驗,也就是說基本上考慮了各種口音及噪音的過濾處理。
????這個成績已經(jīng)比現(xiàn)只會聽英的蘋果iri要強多了,畢竟iri現(xiàn)能夠識別的也是比較標準的英音。不信你拿印口音和加坡口音的英語錄音片段試試看iri能夠識別出多少來。
????如果是一臺模擬性能接近雙核2g以上主頻電腦上,這個指標的識別水平將會提升到2秒以內(nèi)達到97%以上準確率,反應時間同識別準確率其實有些沖突,因為要識別加準確必須要原始版本的語音語料庫基礎(chǔ)資料來源加豐富。
????聲音采樣越廣泛識別準確率越高,而語音樣本庫越龐大,用于匹配的時間就會越久導致反應時間的延長,因此語音樣本的抽樣壓縮和語音匹配算法一直是克里優(yōu)化的倆個重點。
????克里一直不停地模擬改進提取語音語義特征值的算法,通過不斷壓縮冗余值,保持不失真的情況下持續(xù)不斷縮小語音樣本語料庫大小,另外一方面也不斷改進對語音語料庫智能匹配算法。
????優(yōu)化算法杜克幫不了什么忙,但是收集可能多的語音樣本杜克卻沒有問題,所以杜克的每一天都過著一種非常充實的生活,日復一日地下載不同類型的語音樣本供克里分析提煉,同時不斷去學習理解克里所創(chuàng)造的這些全的處理算法,要敲開麻省理工的大門。
????杜克必須要有一篇體現(xiàn)自己能力的世界領(lǐng)先水準的語音識別基礎(chǔ)理論創(chuàng)性論,可是克里的知識庫并沒有現(xiàn)成的語音識別知識,這些對于克里來說太老舊了,老舊到比萊姆都沒有為克里增加這些知識。
????而克里現(xiàn)做的就是地球上現(xiàn)有語音識別理論和算法基礎(chǔ)上,利用他強悍到無邊的模擬能力,不斷地模擬各種不同的語音處理算法。
????通過模擬來找到一種加有效的--這種方法雖然有些笨拙,但是有了克里超強的運算能力,畢竟每秒鐘成千上萬種可能算法都可以模擬,使得這種笨拙的方法也有相當?shù)男Ч?,找出了好幾種可能的優(yōu)化算法,將識別率和反應時間提升到了一個的高。
????可是要將這些成果用地球人能夠理解的語言和理論寫出來,還要讓人能夠看懂,不管是對克里還是杜克來說都是一個挑戰(zhàn),因為克里不是以01為核心的機械二進制思維模式,而是生物多態(tài)思維模式。