2016-2022 All Rights Reserved.平安財經(jīng)網(wǎng).復制必究 聯(lián)系QQ280 715 8082 備案號:閩ICP備19027007號-6
本站除標明“本站原創(chuàng)”外所有信息均轉(zhuǎn)載自互聯(lián)網(wǎng) 版權歸原作者所有。
本周于預印本服務器Arxiv.org上發(fā)布的一項新研究中,多倫多大學和致力于促進AI的獨立非營利組織Vector Institute的科學家提出了BabyAI ++,該平臺用于研究描述性文本是否有助于AI在動態(tài)范圍內(nèi)進行概括。環(huán)境。它和幾個基準模型都將很快在GitHub上提供。
機器學習中最強大的技術之一-強化學習,即通過獎勵激勵軟件代理實現(xiàn)目標,也是最有缺陷的技術之一。它的樣本效率低下,這意味著需要大量的計算周期才能完成,并且沒有其他數(shù)據(jù)來覆蓋變化,因此它很難適應與訓練環(huán)境不同的環(huán)境。
BabyAI ++的級別由可以拾取和放置的對象組成??梢越怄i和打開的門;以及代理商必須承擔的各種任務。像環(huán)境本身一樣,任務是隨機生成的,并通過“嬰兒語言”(一種使用一部分英語詞匯的組合語言)傳達給代理。
上述文本揭示了正在使用的瓷磚類型以及與每個瓷磚匹配的顏色。由于顏色和圖塊類型之間的配對是隨機的,因此代理必須了解其描述才能正確導航地圖。
在BabyAI ++中,每個級別都分為兩種配置:培訓和測試。在訓練配置中,代理會暴露于該級別中的所有圖塊和顏色類型,但會阻止顏色類型對的某些組合。在測試配置中,將啟用所有顏色類型對,從而迫使代理使用語言基礎將圖塊的類型與顏色相關聯(lián)。
本文介紹了使用基準模型進行的幾項實驗,其中一項(注意力融合)使用所謂的注意力機制將相關文本嵌入(數(shù)學表示)分配給場景嵌入特征圖(映射嵌入的功能)上的位置到要素空間或AI處理的變量所在的尺寸)。對于最困難的級別,此注意力融合模型的測試成功率(經(jīng)過5個步驟或動作后達到60%的測試成功率)比最具挑戰(zhàn)性的次優(yōu)模型高16.2%,并且使用更少的幀完成了該級別的圖片數(shù)量(約65相比75)。
2016-2022 All Rights Reserved.平安財經(jīng)網(wǎng).復制必究 聯(lián)系QQ280 715 8082 備案號:閩ICP備19027007號-6
本站除標明“本站原創(chuàng)”外所有信息均轉(zhuǎn)載自互聯(lián)網(wǎng) 版權歸原作者所有。