您的位置: 首頁 >互聯(lián)網(wǎng) >

模型根據(jù)衛(wèi)星圖像標(biāo)記道路特征 使用人工智能豐富數(shù)字地圖

2022-07-19 16:43:21 編輯:水以嘉 來源:
導(dǎo)讀 最近小茹姐發(fā)現(xiàn)模型根據(jù)衛(wèi)星圖像標(biāo)記道路特征 使用人工智能豐富數(shù)字地圖這個話題相信很多小伙伴們都很感興趣吧,那么今天就帶大家了解...

最近小茹姐發(fā)現(xiàn)模型根據(jù)衛(wèi)星圖像標(biāo)記道路特征 使用人工智能豐富數(shù)字地圖這個話題相信很多小伙伴們都很感興趣吧,那么今天就帶大家了解下模型根據(jù)衛(wèi)星圖像標(biāo)記道路特征 使用人工智能豐富數(shù)字地圖的具體詳情,那么小茹姐就來給大家說說具體的一些問題吧,希望對大家有所幫助。

麻省理工學(xué)院和卡塔爾計算機研究所(QCRI)的研究人員發(fā)明了一個模型,該模型使用衛(wèi)星圖像標(biāo)記數(shù)字地圖中的道路特征,可以幫助改善GPS導(dǎo)航。

向駕駛員顯示有關(guān)其路線的更多詳細(xì)信息通??梢詭椭麄冊谀吧奈恢脤?dǎo)航。例如,車道計數(shù)可以使GPS系統(tǒng)警告駕駛員偏離或合并車道。合并有關(guān)停車位的信息可以幫助駕駛員提前計劃,而繪制自行車道則可以幫助騎自行車的人談判繁忙的城市街道。提供有關(guān)道路狀況的最新信息也可以改善救災(zāi)計劃。

但是,創(chuàng)建詳細(xì)的地圖是一項昂貴且耗時的過程,大部分由大型公司(例如Google)完成,這些公司通過綁在引擎蓋上的攝像頭向周圍的車輛發(fā)送車輛,以捕獲該地區(qū)道路的視頻和圖像。將其與其他數(shù)據(jù)結(jié)合可以創(chuàng)建準(zhǔn)確的最新地圖。但是,由于此過程很昂貴,因此世界上的某些地區(qū)被忽略了。

一種解決方案是在衛(wèi)星圖像上釋放機器學(xué)習(xí)模型(更易于定期獲取和更新),以自動標(biāo)記道路特征。但是道路可能會被樹木和建筑物遮擋,這是一項艱巨的任務(wù)。麻省理工學(xué)院和QCRI研究人員在人工智能促進協(xié)會會議上發(fā)表的一篇論文中描述了“ RoadTagger”,它使用神經(jīng)網(wǎng)絡(luò)架構(gòu)的組合來自動預(yù)測后面的車道和道路類型(住宅或高速公路)的數(shù)量障礙物。

在對20個城市的數(shù)字地圖上被遮擋的道路上測試RoadTagger時,該模型對車道號的準(zhǔn)確度為77%,對推斷的道路類型的準(zhǔn)確度為93%。研究人員還計劃使RoadTagger能夠預(yù)測其他特征,例如停車位和自行車道。

“最新的數(shù)字地圖來自大公司最關(guān)心的地方。如果您在他們不太在意的地方,則在地圖質(zhì)量方面處于劣勢。”合著者,電機工程和計算機科學(xué)系(EECS)的教授Sam Madden說。以及計算機科學(xué)與人工智能實驗室(CSAIL)的研究員。“我們的目標(biāo)是使生成高質(zhì)量數(shù)字地圖的過程自動化,以便可以在任何/地區(qū)使用。”

結(jié)合CNN和GNN

Madden說,QCRI所在的卡塔爾“不是建造數(shù)字地圖的大公司的優(yōu)先事項”。然而,它正在不斷地建設(shè)新的道路,并改善舊的道路,尤其是為主辦2022年FIFA世界杯做準(zhǔn)備。

麥登說:“在訪問卡塔爾時,我們經(jīng)歷了Uber司機無法弄清楚自己要去哪里的經(jīng)歷,因為地圖太近了,” “如果導(dǎo)航應(yīng)用程序沒有正確的信息,那么對于諸如車道合并之類的事情,這可能會令人沮喪甚至更糟。”

RoadTagger依賴于通常用于圖像處理任務(wù)的卷積神經(jīng)網(wǎng)絡(luò)(CNN)和圖神經(jīng)網(wǎng)絡(luò)(GNN)的新穎組合。GNN在圖中連接的節(jié)點之間建立模型關(guān)系,并已廣泛用于分析諸如社交網(wǎng)絡(luò)和分子動力學(xué)之類的事物。該模型是“端到端”的,這意味著它僅饋送原始數(shù)據(jù)并自動產(chǎn)生輸出,而無需人工干預(yù)。

CNN將目標(biāo)道路的原始衛(wèi)星圖像作為輸入。GNN將道路分為大約20米的路段,即“平鋪”。每個圖塊都是一個單獨的圖形節(jié)點,通過沿道路的線連接。對于每個節(jié)點,CNN都會提取道路特征,并與其直接鄰居共享該信息。道路信息會沿著整個圖形傳播,每個節(jié)點都會收到其他每個節(jié)點有關(guān)道路屬性的信息。如果圖像中遮擋了某個圖塊,RoadTagger將使用道路上所有圖塊的信息來預(yù)測遮擋的背后。

研究人員說,這種組合架構(gòu)代表了更像人類的直覺。假設(shè)四車道的道路的一部分被樹木遮擋,因此某些圖塊僅顯示兩條車道。人們可以輕易地推測出樹木背后隱藏著兩條車道。傳統(tǒng)的機器學(xué)習(xí)模型(例如CNN)僅提取單個圖塊的特征,最有可能預(yù)測被遮擋的圖塊是一條兩條車道。

他說:“人類可以使用相鄰圖塊中的信息來猜測被遮擋的圖塊中的車道數(shù)量,但是網(wǎng)絡(luò)無法做到這一點。” “我們的方法試圖模仿人類的自然行為,我們從CNN捕獲本地信息,從GNN捕獲全球信息,以做出更好的預(yù)測。”

學(xué)習(xí)權(quán)重

為了訓(xùn)練和測試RoadTagger,研究人員使用了稱為OpenStreetMap的真實世界地圖數(shù)據(jù)集,該數(shù)據(jù)集使用戶可以編輯和管理全球數(shù)字地圖。他們從該數(shù)據(jù)集中,從包括波士頓,芝加哥,華盛頓和西雅圖在內(nèi)的20個城市的688平方公里地圖上收集了已確認(rèn)的道路屬性。然后,他們從Google Maps數(shù)據(jù)集中收集了相應(yīng)的衛(wèi)星圖像。

在培訓(xùn)中,RoadTagger學(xué)習(xí)了CNN和GNN的權(quán)重-這些權(quán)重為特征和節(jié)點連接分配了不同程度的重要性。CNN從圖塊的像素圖案中提取特征,而GNN沿圖傳播學(xué)習(xí)的特征。從道路的隨機選擇子圖中,系統(tǒng)學(xué)習(xí)預(yù)測每個圖塊的道路特征。這樣,它會自動了解哪些圖像特征有用,以及如何沿圖傳播這些特征。例如,如果目標(biāo)圖塊具有不清晰的車道標(biāo)記,但是其相鄰圖塊具有四個具有清晰車道標(biāo)記的車道,并且共享相同的道路寬度,則目標(biāo)圖塊很可能也具有四個車道。在這種情況下,模型會自動獲悉道路寬度是有用的圖像特征,因此,如果兩個相鄰的圖塊共享相同的道路寬度,

給定OpenStreetMap訓(xùn)練中未見的道路,該模型將道路分解為小塊,并使用其學(xué)習(xí)的權(quán)重進行預(yù)測。該模型的任務(wù)是預(yù)測被遮擋的圖塊中的車道數(shù)量,該模型指出相鄰圖塊具有匹配的像素模式,因此共享信息的可能性很高。因此,如果這些圖塊具有四個車道,則被遮擋的圖塊也必須具有四個車道。

在另一個結(jié)果中,RoadTagger在合成的,極具挑戰(zhàn)性的道路中斷數(shù)據(jù)集中準(zhǔn)確預(yù)測了車道號。作為一個示例,具有兩個車道的立交橋覆蓋了具有四個車道的目標(biāo)道路的幾塊瓷磚。該模型檢測到立交橋的像素模式不匹配,因此它忽略了覆蓋圖塊上的兩條車道,準(zhǔn)確地預(yù)測了下面的四個車道。

研究人員希望使用RoadTagger來幫助人們快速驗證并批準(zhǔn)對數(shù)據(jù)集(如OpenStreetMap)中基礎(chǔ)結(jié)構(gòu)的持續(xù)修改,其中許多地圖都不包含車道數(shù)或其他詳細(xì)信息。Bastani說,一個特別感興趣的地區(qū)是泰國,那里的道路在不斷變化,但是數(shù)據(jù)集中幾乎沒有更新。

“曾經(jīng)被標(biāo)記為土路的道路已經(jīng)鋪好,所以最好繼續(xù)行駛,并且一些交叉路口已經(jīng)完全建成。每年都有變化,但是數(shù)字地圖已經(jīng)過時了。”他說。“我們希望根據(jù)最新圖像不斷更新此類道路屬性。”


免責(zé)聲明:本文由用戶上傳,如有侵權(quán)請聯(lián)系刪除!

最新文章

精彩推薦

圖文推薦

點擊排行

2016-2022 All Rights Reserved.平安財經(jīng)網(wǎng).復(fù)制必究 聯(lián)系QQ280 715 8082   備案號:閩ICP備19027007號-6

本站除標(biāo)明“本站原創(chuàng)”外所有信息均轉(zhuǎn)載自互聯(lián)網(wǎng) 版權(quán)歸原作者所有。