您的位置: 首頁(yè) >科技 >

亞馬遜的人工智能改善了語(yǔ)音的情感檢測(cè)

2022-09-01 03:56:51 編輯:印福茗 來(lái)源:
導(dǎo)讀 從某人聲音的音調(diào)中可以得到很多東西,這是一種自然的情感管道。 情緒有一系列的應(yīng)用:它可以通過(guò)幫助檢測(cè)癡呆或心臟病發(fā)作的早期跡象來(lái)幫...

從某人聲音的音調(diào)中可以得到很多東西,這是一種自然的情感管道。 情緒有一系列的應(yīng)用:它可以通過(guò)幫助檢測(cè)癡呆或心臟病發(fā)作的早期跡象來(lái)幫助健康監(jiān)測(cè),它有可能使會(huì)話AI系統(tǒng)更吸引人和更有反應(yīng)。 總有一天,情感甚至可能提供隱性反饋,幫助谷歌助理、蘋(píng)果Siri和亞馬遜Alexa等語(yǔ)音助理從錯(cuò)誤中吸取教訓(xùn)。

情緒分類(lèi)人工智能并不是什么新的東西,但傳統(tǒng)的方法是受監(jiān)督的,這意味著他們攝入根據(jù)說(shuō)話者的情緒狀態(tài)標(biāo)記的訓(xùn)練數(shù)據(jù)。 亞馬遜的科學(xué)家們最近采取了一種不同的方法,他們?cè)谝黄A(yù)定在聲學(xué)、語(yǔ)音和信號(hào)處理國(guó)際會(huì)議上發(fā)表的論文中描述了這一點(diǎn)。 他們沒(méi)有提供一個(gè)詳盡注釋的“情感”語(yǔ)料庫(kù)來(lái)教授一個(gè)系統(tǒng),而是提供了一個(gè)對(duì)抗性的自動(dòng)編碼器,一個(gè)公開(kāi)可用的數(shù)據(jù)集,其中包含來(lái)自10個(gè)不同說(shuō)話者的10,000個(gè)話語(yǔ)。 結(jié)果呢? 神經(jīng)網(wǎng)絡(luò)在判斷人們聲音中的價(jià)態(tài)或情感價(jià)值方面的準(zhǔn)確性高達(dá)4%。

這項(xiàng)研究基于亞馬遜Alexa團(tuán)隊(duì)正在進(jìn)行的努力,從用戶的聲音中可靠地確定用戶的情緒或情緒狀態(tài)。

正如論文合著者和Alexa語(yǔ)言組高級(jí)應(yīng)用科學(xué)家Viktor Rozgic在一篇博客文章中解釋的那樣,對(duì)抗性自動(dòng)編碼器是由編碼器組成的兩部分模型,它學(xué)習(xí)產(chǎn)生編碼訓(xùn)練示例所有屬性的輸入語(yǔ)音的緊湊(或潛在)表示,以及一個(gè)解碼器,它從緊湊表示中重建輸入。

研究人員的情緒表示由三個(gè)網(wǎng)絡(luò)節(jié)點(diǎn)組成,三個(gè)情緒度量中的每一個(gè)節(jié)點(diǎn):價(jià)態(tài)、激活(無(wú)論說(shuō)話人是警覺(jué)的、參與的還是被動(dòng)的)和支配(無(wú)論說(shuō)話人是否感覺(jué)到控制了情況)。 培訓(xùn)分三個(gè)階段進(jìn)行,第一階段包括使用沒(méi)有標(biāo)簽的數(shù)據(jù)單獨(dú)培訓(xùn)編碼器和解碼器。 在第二階段,對(duì)抗性訓(xùn)練-一種技術(shù),在這種技術(shù)中,對(duì)抗性鑒別器試圖區(qū)分編碼器產(chǎn)生的真實(shí)表示調(diào)整編碼器。 在第三階段,編碼器被調(diào)諧以確保潛在的情感表示預(yù)測(cè)訓(xùn)練數(shù)據(jù)的情感標(biāo)簽。

在涉及句子級(jí)特征表示的“手工工程”來(lái)捕獲關(guān)于語(yǔ)音信號(hào)的信息的實(shí)驗(yàn)中,研究人員報(bào)告說(shuō),他們的人工智能系統(tǒng)在評(píng)估價(jià)態(tài)方面比常規(guī)訓(xùn)練的網(wǎng)絡(luò)了3%的更好的準(zhǔn)確性。 此外,他們說(shuō),當(dāng)網(wǎng)絡(luò)被提供一系列表示20毫秒幀或音頻片段的聲學(xué)特性時(shí),改進(jìn)是4%。

亞馬遜不是唯一一家研究改進(jìn)的基于語(yǔ)音的情感檢測(cè)的公司,值得注意。 麻省理工學(xué)院媒體實(shí)驗(yàn)室SpinoffAffectiva最近展示了一個(gè)神經(jīng)網(wǎng)絡(luò),SoundNet,它可以在1.2秒內(nèi)從音頻數(shù)據(jù)中對(duì)憤怒進(jìn)行分類(lèi)-就在人類(lèi)感知憤怒所需的時(shí)間內(nèi)-而不管說(shuō)話者的語(yǔ)言如何。 同時(shí),創(chuàng)業(yè)公司Cogito的AI被退伍事務(wù)部用來(lái)分析創(chuàng)傷后應(yīng)激障礙退伍的聲音,以確定他們是否需要立即幫助。


免責(zé)聲明:本文由用戶上傳,如有侵權(quán)請(qǐng)聯(lián)系刪除!

最新文章

精彩推薦

圖文推薦

點(diǎn)擊排行

2016-2022 All Rights Reserved.平安財(cái)經(jīng)網(wǎng).復(fù)制必究 聯(lián)系QQ280 715 8082   備案號(hào):閩ICP備19027007號(hào)-6

本站除標(biāo)明“本站原創(chuàng)”外所有信息均轉(zhuǎn)載自互聯(lián)網(wǎng) 版權(quán)歸原作者所有。