2016-2022 All Rights Reserved.平安財經網.復制必究 聯系QQ280 715 8082 備案號:閩ICP備19027007號-6
本站除標明“本站原創(chuàng)”外所有信息均轉載自互聯網 版權歸原作者所有。
Google今天宣布在Google翻譯中發(fā)布英語到西班牙語以及芬蘭語,匈牙利語和波斯語到英語的性別專用翻譯,這些翻譯利用新的范例來通過重寫或后期編輯初始翻譯來解決性別偏見。這家科技巨頭聲稱,這種方法比支持Google Translate的針對性別的土耳其語到英語翻譯的早期技術更具可擴展性,主要是因為它不依賴于數據密集型的性別中立檢測器。
Google Research高級軟件工程師梅爾文·約翰遜(Melvin Johnson)寫道:“自最初發(fā)布以來,我們已經取得了重大進展,不僅提高了按性別劃分的翻譯質量,還將其擴展到另外4種語言對。”“我們致力于進一步解決Google Translate中的性別偏見,并計劃將這項工作擴展到文檔級翻譯。”
正如約翰遜所解釋的那樣,用于土耳其語到英語性別特定翻譯的舊分類器很費力地適應新語言,但未能使用神經機器翻譯(NMT)系統(tǒng)獨立生成男性和女性翻譯。而且,它無法顯示多達40%的合格查詢的針對性別的翻譯,因為除性別相關現象外,這兩種翻譯通常不完全相同。
相比之下,新的基于重寫的方法首先生成翻譯,然后對其進行審閱,以識別性別中立的源短語產生特定性別翻譯的實例。如果真是如此,那么句子級的重寫者會選擇另一種性別翻譯,然后對第一和重寫譯文進行審核,以確保唯一的區(qū)別是性別。
根據Google的說法,構建重寫器涉及生成數百萬個由成對短語組成的訓練示例,每個短語都包含男性和女性翻譯。由于數據不易獲得,因此Google Translate團隊不得不從大型單語數據集開始,通過將男性代詞從男性轉換為女性(或相反)來提出候選者重寫。對于這種重寫語料庫,工程師采用了內部語言模型,該模型對數百萬個英語句子進行了訓練,以選擇最佳人選,從而將訓練數據從男性輸入轉換為女性輸出,反之亦然。
2016-2022 All Rights Reserved.平安財經網.復制必究 聯系QQ280 715 8082 備案號:閩ICP備19027007號-6
本站除標明“本站原創(chuàng)”外所有信息均轉載自互聯網 版權歸原作者所有。