2016-2022 All Rights Reserved.平安財(cái)經(jīng)網(wǎng).復(fù)制必究 聯(lián)系QQ280 715 8082 備案號:閩ICP備19027007號-6
本站除標(biāo)明“本站原創(chuàng)”外所有信息均轉(zhuǎn)載自互聯(lián)網(wǎng) 版權(quán)歸原作者所有。
Google以其在研究和開發(fā)方面的努力而聞名,該研究旨在向不同和地區(qū)的用戶提供上下文信息。為了在推進(jìn)這一計(jì)劃,這家科技巨頭在其Google for India活動中宣布了針對語言的多語言表示形式,或簡稱為MuRIL。MuRIL被吹捧為一種現(xiàn)代的多語言檢測模型,旨在在多種區(qū)域語言中提供基于上下文和基于情感的搜索結(jié)果。是一個多元化的,擁有數(shù)十種主流語言。對于像Google這樣的國公司來說,這使得吸引用戶變得更加復(fù)雜。但是使用MuRIL,任務(wù)可能會變得稍微容易一些。讓我們通過此公告詳細(xì)了解Google希望如何轉(zhuǎn)變的Google搜索。
什么是Google的MuRIL?
語言的多語言表示形式是BERT,是變形金剛的雙向編碼器表示形式的縮寫。那是什么 BERT是一種基于AI的技術(shù),它使用自然語言來區(qū)分人們正在搜索的內(nèi)容的細(xì)微差別。
例如,“”一詞在搜索詞中可以表示不同的事物,例如“分行”或“河岸”。為了幫助進(jìn)行這些查詢,Google去年在其搜索產(chǎn)品中加入了BERT算法,以使查詢更加相關(guān)。
新推出的MuRIL旨在進(jìn)一步解決與Google搜索上的區(qū)域語言用戶相關(guān)的問題。它已經(jīng)接受了總共17種語言的預(yù)培訓(xùn)-阿薩姆語,孟加拉語,英語,古吉拉特語,印地語,卡納達(dá)語,克什米爾語,馬拉雅拉姆語,馬拉地語,尼泊爾語,奧里亞語,旁遮普語,梵語,信德語,泰米爾語,泰盧固語和烏爾都語(按字母順序)。這些主要語言涵蓋了人口的絕大多數(shù)。
為什么將其放置到位?
谷歌表示,有很多用戶使用英語進(jìn)行Google搜索。例如,考慮有幾位Oriya或泰盧固語的講者會用英語鍵入他們的查詢,但可能不熟練用語言來解釋結(jié)果。根據(jù)Google的說法,當(dāng)您意識到以母語書寫語言通常會比較困難,并且通常需要三倍的時間(英語)時,這種情況可能會變得更加普遍。
對于此類用戶,搜索將在合適的情況下以17種受支持的語言顯示相關(guān)內(nèi)容。盡管Google并未明確說明這些自動推薦的因素,但我們猜測地理位置和搜索歷史與它有很大關(guān)系。該功能將首先以五種語言推出:印地語,孟加拉語,馬拉地語,泰米爾語和泰盧固語。
Google的新MuRIL算法可以幫助您解決的另一種方法是在解釋音譯文本時,包括您使用羅馬腳本編寫印地語單詞的時間。例如,“ Achha hua account bandh nahi hua”是一個短語,現(xiàn)在將具有肯定的含義,而不是以前的否定。谷歌還表示,諸如“ Shirdi ke sai baba”之類的搜索查詢現(xiàn)在將針對個性而不是位置給出準(zhǔn)確的結(jié)果。
然后,Google還使用MuRIL將對語言選擇器的支持?jǐn)U展到Google Assistant,Discover和Google Maps之類的應(yīng)用程序。此外,您現(xiàn)在可以在Google搜索頁面上在英語和四種其他語言(泰米爾語,泰盧固語,孟加拉語和馬拉地語,除了印地語)之間進(jìn)行切換。
可能性是無止境
谷歌已經(jīng)宣布將使MuRIL免費(fèi)開放源碼。這意味著其生態(tài)系統(tǒng)中的成千上萬的應(yīng)用程序開發(fā)人員可以利用這種復(fù)雜的自然語言技術(shù)為地區(qū)語言用戶開發(fā)更好的產(chǎn)品。例如,具有搜索引擎的應(yīng)用程序的開發(fā)人員,包括諸如亞馬遜之類的電子商務(wù)應(yīng)用程序,諸如Facebook之類的社交應(yīng)用程序,可能會利用這項(xiàng)技術(shù),并向用戶顯示更多相關(guān)內(nèi)容。
為了實(shí)現(xiàn)Google達(dá)到下一個十億用戶的夢想,MuRIL似乎是朝著正確方向邁出的一步。
2016-2022 All Rights Reserved.平安財(cái)經(jīng)網(wǎng).復(fù)制必究 聯(lián)系QQ280 715 8082 備案號:閩ICP備19027007號-6
本站除標(biāo)明“本站原創(chuàng)”外所有信息均轉(zhuǎn)載自互聯(lián)網(wǎng) 版權(quán)歸原作者所有。