2016-2022 All Rights Reserved.平安財經(jīng)網(wǎng).復(fù)制必究 聯(lián)系QQ280 715 8082 備案號:閩ICP備19027007號-6
本站除標(biāo)明“本站原創(chuàng)”外所有信息均轉(zhuǎn)載自互聯(lián)網(wǎng) 版權(quán)歸原作者所有。
在過去的十年左右的時間里,機器學(xué)習(xí)的進(jìn)步為開發(fā)越來越先進(jìn)的語音識別工具鋪平了道路。通過分析人類語音的音頻文件,這些工具可以學(xué)習(xí)識別不同語言的單詞和短語,并將其轉(zhuǎn)換為機器可讀格式。
盡管幾種基于機器學(xué)習(xí)的模型在語音識別任務(wù)上已經(jīng)取得了可喜的成果,但它們并非總是在所有語言中都表現(xiàn)良好。例如,當(dāng)一種語言的詞匯表中包含許多發(fā)音相似的單詞時,語音識別系統(tǒng)的性能可能會大大下降。
圣雄甘地特派團(tuán)工程技術(shù)學(xué)院和杰比信息技術(shù)學(xué)院的研究人員已經(jīng)開發(fā)出一種語音識別系統(tǒng)來解決這個問題。在Springer Link的國際語音技術(shù)雜志上發(fā)表的一篇論文中介紹了這個新系統(tǒng),該系統(tǒng)將人工神經(jīng)網(wǎng)絡(luò)(ANN)與稱為對立人工蜂群(OABC)的優(yōu)化技術(shù)相結(jié)合。
研究人員在論文中寫道:“在這項工作中,使用Levenberg-Marquardt算法重新設(shè)計了ANN的默認(rèn)結(jié)構(gòu),以準(zhǔn)確地檢索最佳預(yù)測率。”“使用對立人工蜂群優(yōu)化技術(shù)進(jìn)一步優(yōu)化了隱層和隱層的神經(jīng)元。”
研究人員開發(fā)的系統(tǒng)的獨特之處在于它使用OABC優(yōu)化算法來優(yōu)化ANN的層和人工神經(jīng)元。顧名思義,人工蜂群(ABC)算法旨在模擬蜜蜂的行為,以解決各種優(yōu)化問題。
研究人員在論文中解釋說:“通常,優(yōu)化算法會在匹配域中隨機初始化解決方案。”“但是這種解決方案可能與最佳解決方案處于相反的方向,從而大大增加了計算開銷。因此,這種基于對立的初始化被稱為OABC。”
研究人員開發(fā)的系統(tǒng)將不同人說的單個單詞視為輸入語音信號。隨后,它提取所謂的調(diào)幅(AM)頻譜圖特征,這些特征本質(zhì)上是特定于聲音的特征。
然后,由模型提取的特征將用于訓(xùn)練ANN以識別人類語音。在大型音頻文件數(shù)據(jù)庫上進(jìn)行訓(xùn)練后,人工神經(jīng)網(wǎng)絡(luò)學(xué)會預(yù)測新的人類語音樣本中的孤立詞。
研究人員在一系列人類語音音頻片段上測試了他們的系統(tǒng),并將其與更傳統(tǒng)的語音識別技術(shù)進(jìn)行了比較。他們的技術(shù)優(yōu)于其他所有方法,獲得了顯著的準(zhǔn)確性得分。
研究人員在論文中寫道:“該方法的靈敏度,特異性和準(zhǔn)確性分別為90.41%,99.66%和99.36%,比所有現(xiàn)有方法都要好。”
將來,語音識別系統(tǒng)可用于在各種環(huán)境中實現(xiàn)更有效的人機通信。此外,他們用于開發(fā)系統(tǒng)的方法可能會啟發(fā)其他團(tuán)隊設(shè)計類似的模型,這些模型結(jié)合了ANN和OABC優(yōu)化技術(shù)。
2016-2022 All Rights Reserved.平安財經(jīng)網(wǎng).復(fù)制必究 聯(lián)系QQ280 715 8082 備案號:閩ICP備19027007號-6
本站除標(biāo)明“本站原創(chuàng)”外所有信息均轉(zhuǎn)載自互聯(lián)網(wǎng) 版權(quán)歸原作者所有。