您的位置: 首頁 >科技 >

Mozilla正在進(jìn)行眾包語音識(shí)別 以使AI為人們服務(wù)

2019-05-23 11:50:33 編輯: 來源:
導(dǎo)讀 數(shù)據(jù)對(duì)于建立偉大的人工智能至關(guān)重要 - 在工業(yè)革命期間,該領(lǐng)域的研究人員將其與煤炭進(jìn)行了比較。擁有它的人將會(huì)前進(jìn)。那些沒有的人將被

數(shù)據(jù)對(duì)于建立偉大的人工智能至關(guān)重要 - 在工業(yè)革命期間,該領(lǐng)域的研究人員將其與煤炭進(jìn)行了比較。擁有它的人將會(huì)前進(jìn)。那些沒有的人將被遺忘。在當(dāng)前的人工智能熱潮中,很明顯誰擁有它:谷歌,F(xiàn)acebook和百度等科技巨頭。

這是令人擔(dān)憂的消息。畢竟,這些公司中的許多公司在搜索和社交媒體等領(lǐng)域幾乎都處于壟斷地位。他們的位置幫助他們收集數(shù)據(jù),這有助于他們建立更好的AI,這有助于他們保持領(lǐng)先于競爭對(duì)手。對(duì)于公司本身而言,這是一個(gè)良性循環(huán),但如果沒有可行的競爭,公司可以 - 并且確實(shí) - 濫用其主導(dǎo)地位。

現(xiàn)在,來自Mozilla(Firefox瀏覽器的非營利性創(chuàng)建者)的一個(gè)新項(xiàng)目正在試驗(yàn)數(shù)據(jù)壟斷的替代方案,要求用戶匯集信息以便為開源AI計(jì)劃提供支持。該公司的第一個(gè)項(xiàng)目名為Common Voice,Mozilla要求志愿者捐贈(zèng)聲音樣本,以建立一個(gè)開源語音識(shí)別系統(tǒng),如為Siri和Alexa提供支持。

Mozilla新興技術(shù)副總裁肖恩懷特告訴The Verge,“目前,控制語音識(shí)別的能力最終只能在少數(shù)人手中,我們不希望看到這一點(diǎn)。” 他說要獲取數(shù)據(jù),大公司“只能過濾掉所有內(nèi)容”,但對(duì)于其他玩家來說,還需要其他方法。“對(duì)我們來說,有趣的問題是,我們能做到這一點(diǎn),以便創(chuàng)建數(shù)據(jù)的人也受益嗎?”他問道。

目前,Mozilla正在收集數(shù)據(jù),但計(jì)劃在今年年底之前提供開源語音識(shí)別功能。(它會(huì)進(jìn)入Firefox瀏覽器嗎?懷特不會(huì)說,但補(bǔ)充說:“我們已經(jīng)計(jì)劃了一些實(shí)驗(yàn)。”)目前,任何人都可以通過讀出來到Common Voice網(wǎng)站并“捐贈(zèng)”他們的聲音例句。他們還可以提供年齡,地點(diǎn),性別和口音等傳記信息。懷特說,這些信息將有助于Mozilla避免偏見創(chuàng)建其語音識(shí)別系統(tǒng),并確保該技術(shù)可以處理重音 - 谷歌和蘋果仍在努力解決這個(gè)問題。

Privacy International的研究員Frederike Kaltheuner表示,這些公司經(jīng)常使用人工智能作為挖掘有價(jià)值的個(gè)人數(shù)據(jù)的“借口”,告訴用戶它將使他們能夠改善某些服務(wù)。她說,這可能是真的,但是為整個(gè)社會(huì)分享這些數(shù)據(jù)的后果不太清楚。“你們作為一個(gè)公民需要的東西與那個(gè)公司的利益之間存在著根本性的利益沖突,”Kaltheuner說。

那么像Common Voice這樣的計(jì)劃如何引誘用戶遠(yuǎn)離現(xiàn)有的 - 并且無可否認(rèn)的方便 - 服務(wù)?畢竟,開源項(xiàng)目比互聯(lián)網(wǎng)存在的時(shí)間更長,但除少數(shù)例外,它們無法與商業(yè)產(chǎn)品競爭。他們根本不提供類似的服務(wù)。

對(duì)于Mozilla來說,答案是個(gè)性化。畢竟,雖然針對(duì)人口規(guī)模的數(shù)據(jù)集進(jìn)行過培訓(xùn)的人工智能系統(tǒng)往往對(duì)普通人來說足夠好,但在滿足較小群體或未在其數(shù)據(jù)中表示的群體的需求時(shí)往往會(huì)失敗。(通常情況下,數(shù)據(jù)偏向于白人男性,業(yè)界默認(rèn)。)

“為了讓我們?cè)跀?shù)據(jù)共享方面獲得成功,除了意識(shí)到有一天他們一直在泄露他們所有的個(gè)人數(shù)據(jù)之外,必須有一種動(dòng)機(jī)[對(duì)于用戶而言],”懷特說。“我們必須讓他們的體驗(yàn)更好,因?yàn)樗麄円呀?jīng)參與。”在Common Voice的情況下,White想要盡可能多的重音數(shù)據(jù)來改善這些人的語音識(shí)別。“我們希望系統(tǒng)能夠更好地為您工作,因?yàn)槟囊恍?shù)據(jù)包含在內(nèi),”他說。

提供個(gè)性化以換取數(shù)據(jù)是一個(gè)很好的主張,但對(duì)于那些打擊數(shù)據(jù)壟斷的人來說,它并不是一顆銀彈。首先,大公司可以向用戶提供他們自己的類似報(bào)價(jià)。(“Alexa不理解你?閱讀這個(gè)10分鐘的劇本,我們將改進(jìn)其語音識(shí)別。”)或者他們可以花錢來填補(bǔ)他們自己的數(shù)據(jù)集中的空白。例如,谷歌讓第三方公司向Redditors支付口音,以記錄他們自己的語音樣本。

White承認(rèn)Common Voice項(xiàng)目對(duì)許多這些問題沒有答案,但Mozilla仍然致力于開放數(shù)據(jù)的核心原因。“這感覺就像一場真正的民主化活動(dòng),”他說。并且有很多組織都有這種精神。有機(jī)器學(xué)習(xí)社區(qū)Kaggle,它有大量用戶貢獻(xiàn)的數(shù)據(jù)集供AI科學(xué)家使用; Elon Musk資助的OpenAI,開放其所有工作; 和Healthcare.ai,發(fā)布免費(fèi)使用的醫(yī)療算法。其中一些人在銷售他們自己的商業(yè)產(chǎn)品(如自動(dòng)駕駛汽車初創(chuàng)公司Comma.AI)時(shí)共同分享開源數(shù)據(jù)和研究。

盡管我們每天與之互動(dòng)的人工智能系統(tǒng)都建立在專有數(shù)據(jù)基礎(chǔ)之上,但是整個(gè)世界的研究人員和機(jī)構(gòu)都在發(fā)布有用的,如果是基本的開源替代方案。

然而,要將這些項(xiàng)目提升到新的水平,開源數(shù)據(jù)的支持者可能會(huì)擁有更高的權(quán)力來接管科技巨頭。深度學(xué)習(xí)公司Skymind的首席執(zhí)行官Chris Nicholson表示,“我們可能需要第三方介入 - 非政府組織,政府,小型私營公司的聯(lián)盟 - 并匯總他們的數(shù)據(jù)。”Nicholson建議共享醫(yī)療保健數(shù)據(jù)可以改善醫(yī)療成像技術(shù)和駕駛員數(shù)據(jù)可以使自動(dòng)駕駛汽車在路上更加自然和直觀。他說,分享這些類型的數(shù)據(jù)集“具有明顯的公共利益。”

那么,捐出你的聲音可能只是一個(gè)開始。


免責(zé)聲明:本文由用戶上傳,如有侵權(quán)請(qǐng)聯(lián)系刪除!

最新文章

精彩推薦

圖文推薦

點(diǎn)擊排行

2016-2022 All Rights Reserved.平安財(cái)經(jīng)網(wǎng).復(fù)制必究 聯(lián)系QQ280 715 8082   備案號(hào):閩ICP備19027007號(hào)-6

本站除標(biāo)明“本站原創(chuàng)”外所有信息均轉(zhuǎn)載自互聯(lián)網(wǎng) 版權(quán)歸原作者所有。