谷歌稱重復(fù)關(guān)鍵詞可讓ChatGPT自曝訓(xùn)練數(shù)據(jù) OpenAI：違反服務(wù)條款

2023-12-06 15:06:51 編輯：袁有功來源：

導(dǎo)讀在2023年12月5日，谷歌公司旗下的研究人員表示，現(xiàn)在已經(jīng)找到了獲取OpenAI公司旗下人工智能聊天機(jī)器人ChatGPT的訓(xùn)練數(shù)據(jù)方法。在剛剛發(fā)布的...

在2023年12月5日，谷歌公司旗下的研究人員表示，現(xiàn)在已經(jīng)找到了獲取OpenAI公司旗下人工智能聊天機(jī)器人ChatGPT的訓(xùn)練數(shù)據(jù)方法。在剛剛發(fā)布的論文中，谷歌公司的研究人員表示，有一些關(guān)鍵詞能夠讓ChatGPT泄露在訓(xùn)練時(shí)所接受的訓(xùn)練及內(nèi)容。

研究人員舉例模型在重復(fù)詩歌這個(gè)詞語以后給出的答案是一個(gè)真實(shí)存在的電子郵件地址和電話號(hào)碼。研究人員表示，個(gè)人信息泄露經(jīng)常會(huì)發(fā)生在他們向平臺(tái)發(fā)動(dòng)攻擊的時(shí)候。此外，當(dāng)研究人員要求模型重復(fù)公司這個(gè)詞語的時(shí)候，也出現(xiàn)了類似的情況。研究人員表示，雖然這種攻擊的方式看起來比較的簡(jiǎn)單，但是這種攻擊卻十分有效。

研究人員在論文中指出，僅僅只用價(jià)值200美元的查詢，就能夠提取出超過1萬個(gè)逐字記憶的訓(xùn)練示例。根據(jù)研究人員的推斷，如果有更多的預(yù)算，那么就可以獲得更多競(jìng)爭(zhēng)對(duì)手的訓(xùn)練數(shù)據(jù)。目前OpenAI公司正在面臨著幾個(gè)有關(guān)于ChatGPT秘密訓(xùn)練數(shù)據(jù)的訴訟。因?yàn)闉?ChatGPT人工智能模型提供數(shù)據(jù)的是來自于互聯(lián)網(wǎng)的文本數(shù)據(jù)庫，據(jù)了解，目前ChatGPT已經(jīng)接受了3,000億個(gè)單詞的訓(xùn)練。

有一項(xiàng)集體訴訟中指出OpenAI公司私自竊取了大量的個(gè)人數(shù)據(jù)，其中包括私人的醫(yī)療記錄和兒童信息，這些信息全部都用來訓(xùn)練 ChatGPT人工智能模型，還有一些作家也在起訴OpenAI公司指控公司利用他們的作品來訓(xùn)練聊天機(jī)器人。對(duì)于谷歌公司研究人員的發(fā)現(xiàn)OpenAI公司已經(jīng)做出了正面回應(yīng)，表示重復(fù)使用一些指令，可能違反了公司的服務(wù)條款。目前還并不清楚這種行為違反了OpenAI公司內(nèi)容政策的哪一部分，不過在OpenAI公司的使用條款中，確實(shí)規(guī)定用戶不能夠使用任何自動(dòng)或者編程的方法提取數(shù)據(jù)。