2016-2022 All Rights Reserved.平安財經(jīng)網(wǎng).復(fù)制必究 聯(lián)系QQ280 715 8082 備案號:閩ICP備19027007號-6
本站除標(biāo)明“本站原創(chuàng)”外所有信息均轉(zhuǎn)載自互聯(lián)網(wǎng) 版權(quán)歸原作者所有。
麻省理工學(xué)院發(fā)明了一種模擬系統(tǒng)來訓(xùn)練無人駕駛汽車,創(chuàng)造了一個具有無限轉(zhuǎn)向可能性的真實世界,幫助汽車在巡航到真正的街道之前學(xué)會導(dǎo)航一系列更糟糕的場景。
自動駕駛車輛的控制系統(tǒng)或“控制器”在很大程度上依賴于來自人類駕駛員的駕駛軌跡的真實世界數(shù)據(jù)集。 從這些數(shù)據(jù)中,他們學(xué)習(xí)如何在各種情況下模擬安全轉(zhuǎn)向控制。 但不幸的是,來自危險的“邊緣案例”的真實數(shù)據(jù),如幾乎崩潰或被迫離開道路或進(jìn)入其他車道,都是真實的。
一些計算機(jī)程序,稱為“模擬引擎”,旨在通過繪制詳細(xì)的虛擬道路來模擬這些情況,以幫助訓(xùn)練控制器恢復(fù)。 但是,從模擬中學(xué)到的控制從來沒有被證明是在一輛全面的車輛上轉(zhuǎn)移到現(xiàn)實中的。
麻省理工學(xué)院的研究人員用他們的真實感模擬器來解決這個問題,稱為虛擬圖像合成和自治轉(zhuǎn)換(VISTA)。 它只使用一個小數(shù)據(jù)集,由駕駛在道路上的人捕獲,從車輛在現(xiàn)實世界中可以接受的軌跡合成幾乎無限多的新觀點。 控制器是獎勵它旅行的距離而不崩潰,所以它必須自己學(xué)習(xí)如何安全到達(dá)目的地。 在這樣做的過程中,車輛學(xué)會安全地駕駛它遇到的任何情況,包括在車道之間轉(zhuǎn)彎或從近車中恢復(fù)控制。
在測試中,在VISTA模擬器中訓(xùn)練的控制器能夠安全地部署到一輛全面的無人駕駛汽車上,并在以前看不見的街道上導(dǎo)航。 在將汽車定位在模擬各種近碰撞情況的越野方向時,控制器還能夠在幾秒鐘內(nèi)成功地將汽車恢復(fù)到安全的駕駛軌跡。 一篇描述該系統(tǒng)的論文已發(fā)表在IEEE機(jī)器人和自動化信函中,并將在即將于5月舉行的ICRA會議上發(fā)表。
第一作者亞歷山大·阿米尼(AlexanderAmini)說:“在這些邊緣情況下,很難收集到人類在這條路上沒有經(jīng)歷過的數(shù)據(jù)。 計算機(jī)科學(xué)和人工智能實驗室(CSA IL)的D.名學(xué)生。 “然而,在我們的模擬中,控制系統(tǒng)可以經(jīng)歷這些情況,學(xué)會從這些情況中恢復(fù)過來,并在部署到現(xiàn)實世界中的車輛時保持強(qiáng)勁。
這項工作是與豐田研究所合作完成的。 參加論文的有:CSAIL博士后Igor Gilitschenski;CSAIL和電氣工程和計算機(jī)科學(xué)系的所有本科生Jacob Phillips、Julia Moseyko和Rohan Banerjee;航空和航天副教授Sertac Karaman;CSAIL主任Daniela Rus以及電氣工程和計算機(jī)科學(xué)Andrew和Erna Viterbi教授。
數(shù)據(jù)驅(qū)動的模擬
從歷史上看,建造用于訓(xùn)練和測試自動駕駛汽車的模擬引擎在很大程度上是一項手工任務(wù)。 公司和大學(xué)經(jīng)常雇用藝術(shù)家和工程師團(tuán)隊來描繪虛擬環(huán)境,在樹上有準(zhǔn)確的道路標(biāo)記、車道,甚至詳細(xì)的樹葉。 一些發(fā)動機(jī)還可以結(jié)合汽車與環(huán)境相互作用的物理,基于復(fù)雜的數(shù)學(xué)模型。
但是,由于在復(fù)雜的現(xiàn)實世界環(huán)境中有許多不同的東西需要考慮,所以實際上不可能將所有東西都集成到模擬器中。 由于這個原因,控制器在模擬中學(xué)到的東西和它們在現(xiàn)實世界中的操作方式之間通常是不匹配的。
相反,麻省理工學(xué)院的研究人員創(chuàng)造了一個他們稱之為“數(shù)據(jù)驅(qū)動”的模擬引擎,它從真實數(shù)據(jù)中綜合出與道路外觀一致的新軌跡,以及場景中所有物體的距離和運(yùn)動。
他們首先從一個開車沿著幾條路行駛的人那里收集視頻數(shù)據(jù),并將其輸入發(fā)動機(jī)。 對于每個幀,引擎將每個像素投影成一種三維點云。 然后,他們在那個世界里放置了一輛虛擬車輛。 當(dāng)車輛發(fā)出轉(zhuǎn)向命令時,發(fā)動機(jī)通過點云合成一個新的軌跡,基于轉(zhuǎn)向曲線和車輛的方向和速度。
然后,引擎使用新的軌跡來渲染一個真實的場景。 為此,它使用一個卷積神經(jīng)網(wǎng)絡(luò)-通常用于圖像處理任務(wù)-來估計深度地圖,其中包含與控制器觀點的對象距離有關(guān)的信息。 然后,它結(jié)合深度圖與一種技術(shù),估計相機(jī)的方向在三維場景。 這一切都有助于確定車輛的位置和相對距離的一切虛擬模擬器。
基于這些信息,它重新調(diào)整原始像素,從車輛的新觀點重新創(chuàng)建世界的三維表示。 它還跟蹤像素的運(yùn)動,以捕捉汽車和人的運(yùn)動,以及其他運(yùn)動物體,在場景中。 Rus說:“這相當(dāng)于為車輛提供無限數(shù)量的可能軌跡?!?因為當(dāng)我們收集物理數(shù)據(jù)時,我們從汽車將遵循的特定軌跡中得到數(shù)據(jù)。 但我們可以修改這個軌跡來涵蓋所有可能的駕駛方式和環(huán)境。 這真的很強(qiáng)大?!?/p>
從零開始強(qiáng)化學(xué)習(xí)
傳統(tǒng)上,研究人員一直在通過遵循人類定義的駕駛規(guī)則或試圖模仿人類司機(jī)來訓(xùn)練自主車輛。 但是,研究人員使他們的控制器在一個“端到端”的框架下從零開始學(xué)習(xí),這意味著它只作為原始傳感器數(shù)據(jù)的輸入-比如道路的視覺觀察-并且從這些數(shù)據(jù)中預(yù)測輸出時的轉(zhuǎn)向命令。
“我們基本上說,”這是一個環(huán)境。 你想做什么就做什么。 阿米尼說:“別撞在車上,呆在車道里?!?/p>
這就需要“強(qiáng)化學(xué)習(xí)”(RL),這是一種試錯機(jī)器學(xué)習(xí)技術(shù),在汽車出錯時提供反饋信號。 在研究人員的模擬引擎中,控制器從不知道如何駕駛、車道標(biāo)記是什么,甚至其他車輛看起來是什么開始,所以它開始執(zhí)行隨機(jī)轉(zhuǎn)向角。 只有當(dāng)它崩潰時,它才會得到反饋信號。 此時,它被傳送到一個新的模擬位置,并必須執(zhí)行一組更好的轉(zhuǎn)向角度,以避免再次崩潰。 超過10到15個小時的訓(xùn)練,它使用這些稀疏反饋信號來學(xué)習(xí)旅行更大和更大的距離而不崩潰。
在模擬成功駕駛10000公里后,作者將學(xué)習(xí)控制器應(yīng)用于現(xiàn)實世界中的全尺寸自主車輛上。 研究人員說,這是第一次在模擬中使用端到端強(qiáng)化學(xué)習(xí)訓(xùn)練的控制器成功地部署到一輛全面的自動駕駛汽車上。 ”“這讓我們很驚訝。 阿米尼說:“不僅控制器以前從未在真正的汽車上使用過,而且它以前也從未見過道路,對人類如何駕駛也一無所知?!?/p>
迫使控制器在所有類型的駕駛場景中運(yùn)行,使它能夠從迷失的位置重新獲得控制-例如半離路或進(jìn)入另一條車道-并在幾秒鐘內(nèi)轉(zhuǎn)向正確的車道。 阿米尼說:“其他最先進(jìn)的控制器都不幸地失敗了,因為他們在訓(xùn)練中從來沒有看到過這樣的數(shù)據(jù)。”
接下來,研究人員希望從一個單一的駕駛軌跡模擬所有類型的道路條件,如夜間和白天,以及晴天和雨天。 他們還希望模擬與道路上其他車輛更復(fù)雜的相互作用。 “如果其他汽車開始在車輛前面移動和跳躍呢?” 拉斯說。 “這些是我們想要開始測試的復(fù)雜的、真實的交互?!?/p>
2016-2022 All Rights Reserved.平安財經(jīng)網(wǎng).復(fù)制必究 聯(lián)系QQ280 715 8082 備案號:閩ICP備19027007號-6
本站除標(biāo)明“本站原創(chuàng)”外所有信息均轉(zhuǎn)載自互聯(lián)網(wǎng) 版權(quán)歸原作者所有。