2016-2022 All Rights Reserved.平安財(cái)經(jīng)網(wǎng).復(fù)制必究 聯(lián)系QQ280 715 8082 備案號(hào):閩ICP備19027007號(hào)-6
本站除標(biāo)明“本站原創(chuàng)”外所有信息均轉(zhuǎn)載自互聯(lián)網(wǎng) 版權(quán)歸原作者所有。
隨著AI語音技術(shù)的發(fā)展,用戶的語音隱私問題愈加嚴(yán)重。不到半年,亞馬遜Alexa和Google Assistant相繼被爆泄露用戶語音信息,有些甚至是語音助手未被喚醒的情況下錄制的用戶語音。亞馬遜和谷歌在全球雇傭數(shù)千名員工專門審查和分析這些用戶錄音,它們的目的是為AI語音訓(xùn)練收集素材從而讓AI更“聰明”。通過這些錄音,有心之人可以定位你的身份、住址甚至是更私密的個(gè)人信息。在AI語音技術(shù)發(fā)展的過程中,隱私問題日益凸顯。
目前各國已經(jīng)開始意識(shí)到互聯(lián)網(wǎng)時(shí)代公民的隱私問題,并相繼醞釀出臺(tái)了相關(guān)的隱私法案。不過AI語音等新技術(shù)的發(fā)展給各國法律不斷提出新的挑戰(zhàn),如何進(jìn)行更有效的隱私保護(hù)仍然是一個(gè)待解的問題。
AI語音技術(shù)上演“竊聽風(fēng)云”
今年4月11日,彭博社披露了亞馬遜在全球雇傭數(shù)千名員工,收聽Echo用戶家中和辦公室錄制的對(duì)話。這些員工由亞馬遜正式員工和承包商組成,他們簽署了保密協(xié)議被禁止公開談?wù)撨@件事。
據(jù)彭博社文章,亞馬遜布加勒斯特(羅馬尼亞首都)辦事處的兩名工作人員說,他們每天工作9小時(shí),每位員工每班解析多達(dá)1000個(gè)音頻片段,這個(gè)辦事處占據(jù)了羅馬尼亞首都Globalworth大樓的前三層,但外面并沒有明顯的亞馬遜標(biāo)志。
無獨(dú)有偶,7月12日,谷歌也被披露通過Google Assistant記錄用戶語音信息并發(fā)送給人類進(jìn)行審查。據(jù)比利時(shí)廣播公司VRT NWS稱,內(nèi)置Google Assistant的設(shè)備正在記錄用戶的對(duì)話和聲音,更可怕的是,超過1000個(gè)錄音已經(jīng)遭到泄露。
VRT NWS聽了超過一千個(gè)錄音片段,發(fā)現(xiàn)這些錄音包含用戶的家庭對(duì)話、電話錄音和更私密的對(duì)話信息,換句話說,在你以為的私密環(huán)境中談?wù)摰膬?nèi)容其實(shí)已經(jīng)被錄音并被用于分析。
更嚴(yán)重的問題是,AI語音技術(shù)造成的隱私泄露問題遠(yuǎn)不止于此。
現(xiàn)在越來越多的人使用內(nèi)置了智能語音技術(shù)的軟件,大家會(huì)通過這些軟件玩游戲、購物、搜索音樂和使用電子地圖等。
當(dāng)你用這些軟件搜索或?yàn)g覽特定內(nèi)容的時(shí)候,你會(huì)發(fā)現(xiàn)在其他軟件上也能看到類似的內(nèi)容甚至是與內(nèi)容有關(guān)的廣告。
讓人意外的是,即使你沒有使用這些軟件,而只是在日常生活中談?wù)摿祟愃频膬?nèi)容,當(dāng)你打開這些軟件的時(shí)候也可能會(huì)看到相關(guān)的內(nèi)容或者收到推送的廣告。
例如你可能和朋友談到中午想吃炸雞,當(dāng)你打開外賣軟件的時(shí)候你可能就會(huì)看到推薦頂部恰巧顯示了炸雞店,或者談到想購買某個(gè)物品,那么當(dāng)你打開購物軟件的時(shí)候可能就會(huì)收到這種物品的店鋪推薦或物品廣告。
這些問題的出現(xiàn)可能是有意的也可能只是偶然,但不管怎樣,隨著AI語音技術(shù)的發(fā)展,用戶的個(gè)人隱私正面臨愈加嚴(yán)峻的挑戰(zhàn)。
收集用戶數(shù)據(jù)為訓(xùn)練AI
按照亞馬遜、谷歌和其他智能語音提供商的說法,搜集的用戶錄音只被用來訓(xùn)練AI語音系統(tǒng),使之能夠理解用戶發(fā)出的語音命令。
“我們認(rèn)真對(duì)待客戶個(gè)人信息的安全和隱私,”亞馬遜發(fā)言人在一封電子郵件聲明中表示。“我們只會(huì)標(biāo)注一小部分Alexa錄音,以便改善客戶體驗(yàn)。這些信息有助于我們訓(xùn)練語音識(shí)別和自然語言處理系統(tǒng),這樣Alexa可以更好地了解您的請(qǐng)求,并確保服務(wù)適合每個(gè)人。”
與亞馬遜的Alexa非常相似,谷歌也會(huì)收集一些Google Assistant的錄音并將其轉(zhuǎn)錄成文本。谷歌曾保證,只有一部分人能夠接觸這些錄音,且只會(huì)被用來訓(xùn)練和改進(jìn)AI語音系統(tǒng),所有這些錄音都不關(guān)聯(lián)用戶身份信息并且都已經(jīng)做了失真處理。
但據(jù)VRT NWS的調(diào)查,泄露的錄音有一部分是在Google Assistant沒有被喚醒的情況下錄制的,并且部分錄音能夠關(guān)聯(lián)到用戶的身份信息,谷歌將之歸因?yàn)橹悄苷Z音助手的“誤喚醒”(false accept)。
“很少有內(nèi)置Google Assistant的設(shè)備會(huì)遇到我們所說的’誤喚醒’,”谷歌的用戶隱私與數(shù)據(jù)產(chǎn)品經(jīng)理David Monsees說到。“這意味著背景中存在一些噪音或談話,我們的軟件將之理解為喚醒詞(如“Ok Google”)。我們有一些保護(hù)措施,以防止在您家中發(fā)生錯(cuò)誤接受。”
與谷歌和亞馬遜類似,蘋果的Siri也有人工助手,他們負(fù)責(zé)判斷Siri對(duì)用戶命令的解釋是否與用戶所說的一致。據(jù)蘋果安全白皮書稱,他們審查的錄音不關(guān)聯(lián)用戶個(gè)人識(shí)別信息,并與一個(gè)隨機(jī)標(biāo)識(shí)符綁定存儲(chǔ)6個(gè)月。之后,數(shù)據(jù)將從隨機(jī)識(shí)別信息中剝離出來,但可能會(huì)存儲(chǔ)更長(zhǎng)的時(shí)間,以提高Siri的語音識(shí)別能力。
企業(yè)承諾保護(hù)隱私但用戶不信任
在被彭博社曝光之后,亞馬遜發(fā)言人通過電子郵件寫道:“對(duì)內(nèi)部工具的訪問受到高度控制,并且僅授予有限數(shù)量的員工,他們需要這些工具來處理極少量的交互樣本,從而培訓(xùn)和改進(jìn)智能語音服務(wù)。”“我們的政策嚴(yán)格禁止員工出于任何其他原因訪問或使用用戶數(shù)據(jù),我們對(duì)系統(tǒng)的濫用采取零容忍政策。”
谷歌的David Monsees于泄漏事件發(fā)生后在博客中寫道“我們正在對(duì)這個(gè)領(lǐng)域的保障措施進(jìn)行全面審查,以防止這種不當(dāng)行為再次發(fā)生。”“在產(chǎn)品開發(fā)中,我們秉持高標(biāo)準(zhǔn)的隱私和安全守則,并讓我們的合作伙伴也遵守這些標(biāo)準(zhǔn)。我們還為您提供管理帳戶中存儲(chǔ)數(shù)據(jù)的工具,您可以完全切斷將音頻數(shù)據(jù)存儲(chǔ)到Google帳戶,也可以選擇每3個(gè)月或18個(gè)月后自動(dòng)刪除數(shù)據(jù)。”
雖然智能語音技術(shù)提供商表達(dá)了對(duì)于隱私保護(hù)的決心和方案,但用戶對(duì)于智能語音技術(shù)還是充斥著擔(dān)憂和防備,尤其擔(dān)心智能語音設(shè)備會(huì)偷聽他們的講話并進(jìn)行錄音,誰也不想自己的個(gè)人隱私被公之于眾。
根據(jù)微軟在今年4月23日發(fā)表的一份報(bào)告顯示,41%的智能語音助手和智能語音技術(shù)用戶表達(dá)了對(duì)信任、隱私和被動(dòng)聆聽的擔(dān)憂。
亞馬遜曾發(fā)起過一項(xiàng)叫Alexa for Hospitality的計(jì)劃,將Echo音箱放入酒店客房,以便為客人提供服務(wù)。但根據(jù)Travel Weekly的消息,Best Western酒店首席執(zhí)行官David Kong說這些設(shè)備的使用率很低,大多數(shù)客人在進(jìn)入他們的房間時(shí)都會(huì)斷開連接。
保護(hù)隱私成共識(shí),隱私立法仍落后
作為當(dāng)下全球炙手可熱的高新技術(shù),AI語音技術(shù)及相關(guān)產(chǎn)品正飛速發(fā)展,并逐漸深入人們的日常生活。
據(jù)Canalys發(fā)布的2019年一季度全球智能音箱產(chǎn)品統(tǒng)計(jì)報(bào)告顯示,2019年一季度全球智能音箱產(chǎn)品出貨量相比2018年一季度增長(zhǎng)了131.4%達(dá)到2070萬臺(tái),全球智能音箱安裝量將自2018年的1.14億臺(tái)上升到2019年的2.079億臺(tái),同比增長(zhǎng)82.4%,中國內(nèi)地將成為今年全球增長(zhǎng)最快的市場(chǎng)。
不過,AI語音技術(shù)和相關(guān)產(chǎn)品的高速發(fā)展更加凸顯了隱私問題的嚴(yán)重性。隨著越來越多的智能語音設(shè)備進(jìn)入人們的生活中,人機(jī)語音交互會(huì)變的更加頻繁,交互內(nèi)容也會(huì)更加多樣,如果目前的隱私現(xiàn)狀不能得到改善,這無疑會(huì)成為一顆隨時(shí)可能引爆的地雷。
2018年5月25日,歐洲《通用數(shù)據(jù)保護(hù)條例》(GDPR)生效,條例規(guī)定用戶數(shù)據(jù)收集方必須清楚地披露收集的任何數(shù)據(jù),聲明數(shù)據(jù)處理的合法基礎(chǔ)和目的,保留數(shù)據(jù)的時(shí)間以及是否與任何第三方或歐盟以外的國家共享數(shù)據(jù)。條例還規(guī)定用戶有權(quán)刪除自身數(shù)據(jù),如果數(shù)據(jù)泄露對(duì)用戶隱私產(chǎn)生不利影響,企業(yè)必須在72小時(shí)內(nèi)報(bào)告任何數(shù)據(jù)泄露。2019年1月21日,谷歌被曝因違反GDPR被法國國家數(shù)據(jù)保護(hù)委員會(huì)處以5000萬歐元的罰款。
2015年10月,美國聯(lián)邦通過《網(wǎng)絡(luò)安全信息共享法》,在《隱私法》的基礎(chǔ)上進(jìn)一步規(guī)定了個(gè)人隱私、自由等私權(quán)利的保護(hù)。不過,美國也在醞釀出臺(tái)更嚴(yán)格的全國性的隱私保護(hù)法案。今年2月27日,美國參議院提出《數(shù)據(jù)隱私法案》;3月14日,美國參議院提出《2019年商業(yè)人臉識(shí)別隱私法案》提案;4月11日,美國參議院提出《隱私權(quán)利法案》等。
2016年11月7日,中國全國人大常委會(huì)頒布《中華人民共和國網(wǎng)絡(luò)安全法》,首次從立法層面對(duì)個(gè)人信息進(jìn)行了定義和不完全列舉。除此之外,世界上還有許多國家也在相繼推進(jìn)自己的隱私立法。
目前,關(guān)于個(gè)人隱私的保護(hù)立法各國都有推進(jìn),有的已經(jīng)出臺(tái),有的還在起草醞釀階段,這對(duì)消費(fèi)者隱私保護(hù)來說是一個(gè)好消息。但是,由于技術(shù)日新月異,新技術(shù)的發(fā)展不斷為各國隱私立法帶來新的挑戰(zhàn),這時(shí)法案的補(bǔ)充、更新就顯得尤為重要。
結(jié)語:隱私泄露為AI語音發(fā)展敲響警鐘
雖然谷歌、亞馬遜等廠家一再強(qiáng)調(diào)不會(huì)濫用用戶數(shù)據(jù)并進(jìn)行嚴(yán)格地保護(hù),各國也相繼出臺(tái)了自己的個(gè)人隱私保護(hù)法案,但問題是用戶數(shù)據(jù)泄露還是成為了現(xiàn)實(shí),這為AI語音產(chǎn)業(yè)的發(fā)展敲響了警鐘。
用戶不愿看到AI帶來便利的同時(shí)也帶來信息泄露的困擾,用戶更不能容忍為了訓(xùn)練AI而被“偷聽”。就像許多新技術(shù)一樣,AI發(fā)展的過程伴隨著問題產(chǎn)生的過程,只不過這次遇到的,是嚴(yán)峻的隱私問題,隱私無小事。
沒人愿意因?yàn)槭褂肁I新技術(shù)而泄露個(gè)人信息,在AI技術(shù)的發(fā)展過程中,如何更有效的保護(hù)用戶的信息是所有人需要思考的問題。
2016-2022 All Rights Reserved.平安財(cái)經(jīng)網(wǎng).復(fù)制必究 聯(lián)系QQ280 715 8082 備案號(hào):閩ICP備19027007號(hào)-6
本站除標(biāo)明“本站原創(chuàng)”外所有信息均轉(zhuǎn)載自互聯(lián)網(wǎng) 版權(quán)歸原作者所有。