亞馬遜谷歌接連暴雷 AI語音隱私問題凸顯

2019-07-23 17:29:00 編輯：來源：億歐

導讀隨著AI語音技術的發(fā)展，用戶的語音隱私問題愈加嚴重。不到半年，亞馬遜Alexa和Google Assistant相繼被爆泄露用戶語音信息，有些甚至是語音

隨著AI語音技術的發(fā)展，用戶的語音隱私問題愈加嚴重。不到半年，亞馬遜Alexa和Google Assistant相繼被爆泄露用戶語音信息，有些甚至是語音助手未被喚醒的情況下錄制的用戶語音。亞馬遜和谷歌在全球雇傭數(shù)千名員工專門審查和分析這些用戶錄音，它們的目的是為AI語音訓練收集素材從而讓AI更“聰明”。通過這些錄音，有心之人可以定位你的身份、住址甚至是更私密的個人信息。在AI語音技術發(fā)展的過程中，隱私問題日益凸顯。

目前各國已經(jīng)開始意識到互聯(lián)網(wǎng)時代公民的隱私問題，并相繼醞釀出臺了相關的隱私法案。不過AI語音等新技術的發(fā)展給各國法律不斷提出新的挑戰(zhàn)，如何進行更有效的隱私保護仍然是一個待解的問題。

AI語音技術上演“竊聽風云”

今年4月11日，彭博社披露了亞馬遜在全球雇傭數(shù)千名員工，收聽Echo用戶家中和辦公室錄制的對話。這些員工由亞馬遜正式員工和承包商組成，他們簽署了保密協(xié)議被禁止公開談論這件事。

據(jù)彭博社文章，亞馬遜布加勒斯特(羅馬尼亞首都)辦事處的兩名工作人員說，他們每天工作9小時，每位員工每班解析多達1000個音頻片段，這個辦事處占據(jù)了羅馬尼亞首都Globalworth大樓的前三層，但外面并沒有明顯的亞馬遜標志。

無獨有偶，7月12日，谷歌也被披露通過Google Assistant記錄用戶語音信息并發(fā)送給人類進行審查。據(jù)比利時廣播公司VRT NWS稱，內(nèi)置Google Assistant的設備正在記錄用戶的對話和聲音，更可怕的是，超過1000個錄音已經(jīng)遭到泄露。

VRT NWS聽了超過一千個錄音片段，發(fā)現(xiàn)這些錄音包含用戶的家庭對話、電話錄音和更私密的對話信息，換句話說，在你以為的私密環(huán)境中談論的內(nèi)容其實已經(jīng)被錄音并被用于分析。

更嚴重的問題是，AI語音技術造成的隱私泄露問題遠不止于此。

現(xiàn)在越來越多的人使用內(nèi)置了智能語音技術的軟件，大家會通過這些軟件玩游戲、購物、搜索音樂和使用電子地圖等。

當你用這些軟件搜索或瀏覽特定內(nèi)容的時候，你會發(fā)現(xiàn)在其他軟件上也能看到類似的內(nèi)容甚至是與內(nèi)容有關的廣告。

讓人意外的是，即使你沒有使用這些軟件，而只是在日常生活中談論了類似的內(nèi)容，當你打開這些軟件的時候也可能會看到相關的內(nèi)容或者收到推送的廣告。

例如你可能和朋友談到中午想吃炸雞，當你打開外賣軟件的時候你可能就會看到推薦頂部恰巧顯示了炸雞店，或者談到想購買某個物品，那么當你打開購物軟件的時候可能就會收到這種物品的店鋪推薦或物品廣告。

這些問題的出現(xiàn)可能是有意的也可能只是偶然，但不管怎樣，隨著AI語音技術的發(fā)展，用戶的個人隱私正面臨愈加嚴峻的挑戰(zhàn)。

收集用戶數(shù)據(jù)為訓練AI

按照亞馬遜、谷歌和其他智能語音提供商的說法，搜集的用戶錄音只被用來訓練AI語音系統(tǒng)，使之能夠理解用戶發(fā)出的語音命令。

“我們認真對待客戶個人信息的安全和隱私，”亞馬遜發(fā)言人在一封電子郵件聲明中表示。“我們只會標注一小部分Alexa錄音，以便改善客戶體驗。這些信息有助于我們訓練語音識別和自然語言處理系統(tǒng)，這樣Alexa可以更好地了解您的請求，并確保服務適合每個人。”

與亞馬遜的Alexa非常相似，谷歌也會收集一些Google Assistant的錄音并將其轉錄成文本。谷歌曾保證，只有一部分人能夠接觸這些錄音，且只會被用來訓練和改進AI語音系統(tǒng)，所有這些錄音都不關聯(lián)用戶身份信息并且都已經(jīng)做了失真處理。

但據(jù)VRT NWS的調(diào)查，泄露的錄音有一部分是在Google Assistant沒有被喚醒的情況下錄制的，并且部分錄音能夠關聯(lián)到用戶的身份信息，谷歌將之歸因為智能語音助手的“誤喚醒”(false accept)。

“很少有內(nèi)置Google Assistant的設備會遇到我們所說的’誤喚醒’，”谷歌的用戶隱私與數(shù)據(jù)產(chǎn)品經(jīng)理David Monsees說到。“這意味著背景中存在一些噪音或談話，我們的軟件將之理解為喚醒詞(如“Ok Google”)。我們有一些保護措施，以防止在您家中發(fā)生錯誤接受。”

與谷歌和亞馬遜類似，蘋果的Siri也有人工助手，他們負責判斷Siri對用戶命令的解釋是否與用戶所說的一致。據(jù)蘋果安全白皮書稱，他們審查的錄音不關聯(lián)用戶個人識別信息，并與一個隨機標識符綁定存儲6個月。之后，數(shù)據(jù)將從隨機識別信息中剝離出來，但可能會存儲更長的時間，以提高Siri的語音識別能力。

企業(yè)承諾保護隱私但用戶不信任

在被彭博社曝光之后，亞馬遜發(fā)言人通過電子郵件寫道：“對內(nèi)部工具的訪問受到高度控制，并且僅授予有限數(shù)量的員工，他們需要這些工具來處理極少量的交互樣本，從而培訓和改進智能語音服務。”“我們的政策嚴格禁止員工出于任何其他原因訪問或使用用戶數(shù)據(jù)，我們對系統(tǒng)的濫用采取零容忍政策。”

谷歌的David Monsees于泄漏事件發(fā)生后在博客中寫道“我們正在對這個領域的保障措施進行全面審查，以防止這種不當行為再次發(fā)生。”“在產(chǎn)品開發(fā)中，我們秉持高標準的隱私和安全守則，并讓我們的合作伙伴也遵守這些標準。我們還為您提供管理帳戶中存儲數(shù)據(jù)的工具，您可以完全切斷將音頻數(shù)據(jù)存儲到Google帳戶，也可以選擇每3個月或18個月后自動刪除數(shù)據(jù)。”

雖然智能語音技術提供商表達了對于隱私保護的決心和方案，但用戶對于智能語音技術還是充斥著擔憂和防備，尤其擔心智能語音設備會偷聽他們的講話并進行錄音，誰也不想自己的個人隱私被公之于眾。

根據(jù)微軟在今年4月23日發(fā)表的一份報告顯示，41%的智能語音助手和智能語音技術用戶表達了對信任、隱私和被動聆聽的擔憂。

亞馬遜曾發(fā)起過一項叫Alexa for Hospitality的計劃，將Echo音箱放入酒店客房，以便為客人提供服務。但根據(jù)Travel Weekly的消息，Best Western酒店首席執(zhí)行官David Kong說這些設備的使用率很低，大多數(shù)客人在進入他們的房間時都會斷開連接。

保護隱私成共識，隱私立法仍落后

作為當下全球炙手可熱的高新技術，AI語音技術及相關產(chǎn)品正飛速發(fā)展，并逐漸深入人們的日常生活。

據(jù)Canalys發(fā)布的2019年一季度全球智能音箱產(chǎn)品統(tǒng)計報告顯示，2019年一季度全球智能音箱產(chǎn)品出貨量相比2018年一季度增長了131.4%達到2070萬臺，全球智能音箱安裝量將自2018年的1.14億臺上升到2019年的2.079億臺，同比增長82.4%，中國內(nèi)地將成為今年全球增長最快的市場。

不過，AI語音技術和相關產(chǎn)品的高速發(fā)展更加凸顯了隱私問題的嚴重性。隨著越來越多的智能語音設備進入人們的生活中，人機語音交互會變的更加頻繁，交互內(nèi)容也會更加多樣，如果目前的隱私現(xiàn)狀不能得到改善，這無疑會成為一顆隨時可能引爆的地雷。

2018年5月25日，歐洲《通用數(shù)據(jù)保護條例》(GDPR)生效，條例規(guī)定用戶數(shù)據(jù)收集方必須清楚地披露收集的任何數(shù)據(jù)，聲明數(shù)據(jù)處理的合法基礎和目的，保留數(shù)據(jù)的時間以及是否與任何第三方或歐盟以外的國家共享數(shù)據(jù)。條例還規(guī)定用戶有權刪除自身數(shù)據(jù)，如果數(shù)據(jù)泄露對用戶隱私產(chǎn)生不利影響，企業(yè)必須在72小時內(nèi)報告任何數(shù)據(jù)泄露。2019年1月21日，谷歌被曝因違反GDPR被法國國家數(shù)據(jù)保護委員會處以5000萬歐元的罰款。

2015年10月，美國聯(lián)邦通過《網(wǎng)絡安全信息共享法》，在《隱私法》的基礎上進一步規(guī)定了個人隱私、自由等私權利的保護。不過，美國也在醞釀出臺更嚴格的全國性的隱私保護法案。今年2月27日，美國參議院提出《數(shù)據(jù)隱私法案》;3月14日，美國參議院提出《2019年商業(yè)人臉識別隱私法案》提案;4月11日，美國參議院提出《隱私權利法案》等。

2016年11月7日，中國全國人大常委會頒布《中華人民共和國網(wǎng)絡安全法》，首次從立法層面對個人信息進行了定義和不完全列舉。除此之外，世界上還有許多國家也在相繼推進自己的隱私立法。

目前，關于個人隱私的保護立法各國都有推進，有的已經(jīng)出臺，有的還在起草醞釀階段，這對消費者隱私保護來說是一個好消息。但是，由于技術日新月異，新技術的發(fā)展不斷為各國隱私立法帶來新的挑戰(zhàn)，這時法案的補充、更新就顯得尤為重要。

結語：隱私泄露為AI語音發(fā)展敲響警鐘

雖然谷歌、亞馬遜等廠家一再強調(diào)不會濫用用戶數(shù)據(jù)并進行嚴格地保護，各國也相繼出臺了自己的個人隱私保護法案，但問題是用戶數(shù)據(jù)泄露還是成為了現(xiàn)實，這為AI語音產(chǎn)業(yè)的發(fā)展敲響了警鐘。

用戶不愿看到AI帶來便利的同時也帶來信息泄露的困擾，用戶更不能容忍為了訓練AI而被“偷聽”。就像許多新技術一樣，AI發(fā)展的過程伴隨著問題產(chǎn)生的過程，只不過這次遇到的，是嚴峻的隱私問題，隱私無小事。

沒人愿意因為使用AI新技術而泄露個人信息，在AI技術的發(fā)展過程中，如何更有效的保護用戶的信息是所有人需要思考的問題。

標簽：亞馬遜谷歌