語言可以幫助AI在新環(huán)境中導航

2022-07-19 06:22:41 編輯：劉輪琴來源：

導讀本周于預印本服務器Arxiv.org上發(fā)布的一項新研究中，多倫多大學和致力于促進AI的獨立非營利組織Vector Institute的科學家提出了BabyAI...

本周于預印本服務器Arxiv.org上發(fā)布的一項新研究中，多倫多大學和致力于促進AI的獨立非營利組織Vector Institute的科學家提出了BabyAI ++，該平臺用于研究描述性文本是否有助于AI在動態(tài)范圍內(nèi)進行概括。環(huán)境。它和幾個基準模型都將很快在GitHub上提供。

機器學習中最強大的技術之一-強化學習，即通過獎勵激勵軟件代理實現(xiàn)目標，也是最有缺陷的技術之一。它的樣本效率低下，這意味著需要大量的計算周期才能完成，并且沒有其他數(shù)據(jù)來覆蓋變化，因此它很難適應與訓練環(huán)境不同的環(huán)境。

BabyAI ++的級別由可以拾取和放置的對象組成?？梢越怄i和打開的門;以及代理商必須承擔的各種任務。像環(huán)境本身一樣，任務是隨機生成的，并通過“嬰兒語言”(一種使用一部分英語詞匯的組合語言)傳達給代理。

上述文本揭示了正在使用的瓷磚類型以及與每個瓷磚匹配的顏色。由于顏色和圖塊類型之間的配對是隨機的，因此代理必須了解其描述才能正確導航地圖。

在BabyAI ++中，每個級別都分為兩種配置：培訓和測試。在訓練配置中，代理會暴露于該級別中的所有圖塊和顏色類型，但會阻止顏色類型對的某些組合。在測試配置中，將啟用所有顏色類型對，從而迫使代理使用語言基礎將圖塊的類型與顏色相關聯(lián)。

本文介紹了使用基準模型進行的幾項實驗，其中一項(注意力融合)使用所謂的注意力機制將相關文本嵌入(數(shù)學表示)分配給場景嵌入特征圖(映射嵌入的功能)上的位置到要素空間或AI處理的變量所在的尺寸)。對于最困難的級別，此注意力融合模型的測試成功率(經(jīng)過5個步驟或動作后達到60%的測試成功率)比最具挑戰(zhàn)性的次優(yōu)模型高16.2%，并且使用更少的幀完成了該級別的圖片數(shù)量(約65相比75)。

標簽：

免責聲明：本文由用戶上傳，如有侵權請聯(lián)系刪除！