模型根據(jù)衛(wèi)星圖像標(biāo)記道路特征使用人工智能豐富數(shù)字地圖

2022-07-19 16:43:21 編輯：水以嘉來(lái)源：

導(dǎo)讀最近小茹姐發(fā)現(xiàn)模型根據(jù)衛(wèi)星圖像標(biāo)記道路特征使用人工智能豐富數(shù)字地圖這個(gè)話題相信很多小伙伴們都很感興趣吧,那么今天就帶大家了解...

最近小茹姐發(fā)現(xiàn)模型根據(jù)衛(wèi)星圖像標(biāo)記道路特征使用人工智能豐富數(shù)字地圖這個(gè)話題相信很多小伙伴們都很感興趣吧,那么今天就帶大家了解下模型根據(jù)衛(wèi)星圖像標(biāo)記道路特征使用人工智能豐富數(shù)字地圖的具體詳情,那么小茹姐就來(lái)給大家說(shuō)說(shuō)具體的一些問(wèn)題吧,希望對(duì)大家有所幫助。

麻省理工學(xué)院和卡塔爾計(jì)算機(jī)研究所(QCRI)的研究人員發(fā)明了一個(gè)模型，該模型使用衛(wèi)星圖像標(biāo)記數(shù)字地圖中的道路特征，可以幫助改善GPS導(dǎo)航。

向駕駛員顯示有關(guān)其路線的更多詳細(xì)信息通?？梢詭椭麄?cè)谀吧奈恢脤?dǎo)航。例如，車(chē)道計(jì)數(shù)可以使GPS系統(tǒng)警告駕駛員偏離或合并車(chē)道。合并有關(guān)停車(chē)位的信息可以幫助駕駛員提前計(jì)劃，而繪制自行車(chē)道則可以幫助騎自行車(chē)的人談判繁忙的城市街道。提供有關(guān)道路狀況的最新信息也可以改善救災(zāi)計(jì)劃。

但是，創(chuàng)建詳細(xì)的地圖是一項(xiàng)昂貴且耗時(shí)的過(guò)程，大部分由大型公司(例如Google)完成，這些公司通過(guò)綁在引擎蓋上的攝像頭向周?chē)能?chē)輛發(fā)送車(chē)輛，以捕獲該地區(qū)道路的視頻和圖像。將其與其他數(shù)據(jù)結(jié)合可以創(chuàng)建準(zhǔn)確的最新地圖。但是，由于此過(guò)程很昂貴，因此世界上的某些地區(qū)被忽略了。

一種解決方案是在衛(wèi)星圖像上釋放機(jī)器學(xué)習(xí)模型(更易于定期獲取和更新)，以自動(dòng)標(biāo)記道路特征。但是道路可能會(huì)被樹(shù)木和建筑物遮擋，這是一項(xiàng)艱巨的任務(wù)。麻省理工學(xué)院和QCRI研究人員在人工智能促進(jìn)協(xié)會(huì)會(huì)議上發(fā)表的一篇論文中描述了“ RoadTagger”，它使用神經(jīng)網(wǎng)絡(luò)架構(gòu)的組合來(lái)自動(dòng)預(yù)測(cè)后面的車(chē)道和道路類(lèi)型(住宅或高速公路)的數(shù)量障礙物。

在對(duì)20個(gè)城市的數(shù)字地圖上被遮擋的道路上測(cè)試RoadTagger時(shí)，該模型對(duì)車(chē)道號(hào)的準(zhǔn)確度為77%，對(duì)推斷的道路類(lèi)型的準(zhǔn)確度為93%。研究人員還計(jì)劃使RoadTagger能夠預(yù)測(cè)其他特征，例如停車(chē)位和自行車(chē)道。

“最新的數(shù)字地圖來(lái)自大公司最關(guān)心的地方。如果您在他們不太在意的地方，則在地圖質(zhì)量方面處于劣勢(shì)。”合著者，電機(jī)工程和計(jì)算機(jī)科學(xué)系(EECS)的教授Sam Madden說(shuō)。以及計(jì)算機(jī)科學(xué)與人工智能實(shí)驗(yàn)室(CSAIL)的研究員。“我們的目標(biāo)是使生成高質(zhì)量數(shù)字地圖的過(guò)程自動(dòng)化，以便可以在任何/地區(qū)使用。”

結(jié)合CNN和GNN

Madden說(shuō)，QCRI所在的卡塔爾“不是建造數(shù)字地圖的大公司的優(yōu)先事項(xiàng)”。然而，它正在不斷地建設(shè)新的道路，并改善舊的道路，尤其是為主辦2022年FIFA世界杯做準(zhǔn)備。

麥登說(shuō)：“在訪問(wèn)卡塔爾時(shí)，我們經(jīng)歷了Uber司機(jī)無(wú)法弄清楚自己要去哪里的經(jīng)歷，因?yàn)榈貓D太近了，” “如果導(dǎo)航應(yīng)用程序沒(méi)有正確的信息，那么對(duì)于諸如車(chē)道合并之類(lèi)的事情，這可能會(huì)令人沮喪甚至更糟。”

RoadTagger依賴(lài)于通常用于圖像處理任務(wù)的卷積神經(jīng)網(wǎng)絡(luò)(CNN)和圖神經(jīng)網(wǎng)絡(luò)(GNN)的新穎組合。GNN在圖中連接的節(jié)點(diǎn)之間建立模型關(guān)系，并已廣泛用于分析諸如社交網(wǎng)絡(luò)和分子動(dòng)力學(xué)之類(lèi)的事物。該模型是“端到端”的，這意味著它僅饋送原始數(shù)據(jù)并自動(dòng)產(chǎn)生輸出，而無(wú)需人工干預(yù)。

CNN將目標(biāo)道路的原始衛(wèi)星圖像作為輸入。GNN將道路分為大約20米的路段，即“平鋪”。每個(gè)圖塊都是一個(gè)單獨(dú)的圖形節(jié)點(diǎn)，通過(guò)沿道路的線連接。對(duì)于每個(gè)節(jié)點(diǎn)，CNN都會(huì)提取道路特征，并與其直接鄰居共享該信息。道路信息會(huì)沿著整個(gè)圖形傳播，每個(gè)節(jié)點(diǎn)都會(huì)收到其他每個(gè)節(jié)點(diǎn)有關(guān)道路屬性的信息。如果圖像中遮擋了某個(gè)圖塊，RoadTagger將使用道路上所有圖塊的信息來(lái)預(yù)測(cè)遮擋的背后。

研究人員說(shuō)，這種組合架構(gòu)代表了更像人類(lèi)的直覺(jué)。假設(shè)四車(chē)道的道路的一部分被樹(shù)木遮擋，因此某些圖塊僅顯示兩條車(chē)道。人們可以輕易地推測(cè)出樹(shù)木背后隱藏著兩條車(chē)道。傳統(tǒng)的機(jī)器學(xué)習(xí)模型(例如CNN)僅提取單個(gè)圖塊的特征，最有可能預(yù)測(cè)被遮擋的圖塊是一條兩條車(chē)道。

他說(shuō)：“人類(lèi)可以使用相鄰圖塊中的信息來(lái)猜測(cè)被遮擋的圖塊中的車(chē)道數(shù)量，但是網(wǎng)絡(luò)無(wú)法做到這一點(diǎn)。” “我們的方法試圖模仿人類(lèi)的自然行為，我們從CNN捕獲本地信息，從GNN捕獲全球信息，以做出更好的預(yù)測(cè)。”

學(xué)習(xí)權(quán)重

為了訓(xùn)練和測(cè)試RoadTagger，研究人員使用了稱(chēng)為OpenStreetMap的真實(shí)世界地圖數(shù)據(jù)集，該數(shù)據(jù)集使用戶可以編輯和管理全球數(shù)字地圖。他們從該數(shù)據(jù)集中，從包括波士頓，芝加哥，華盛頓和西雅圖在內(nèi)的20個(gè)城市的688平方公里地圖上收集了已確認(rèn)的道路屬性。然后，他們從Google Maps數(shù)據(jù)集中收集了相應(yīng)的衛(wèi)星圖像。

在培訓(xùn)中，RoadTagger學(xué)習(xí)了CNN和GNN的權(quán)重-這些權(quán)重為特征和節(jié)點(diǎn)連接分配了不同程度的重要性。CNN從圖塊的像素圖案中提取特征，而GNN沿圖傳播學(xué)習(xí)的特征。從道路的隨機(jī)選擇子圖中，系統(tǒng)學(xué)習(xí)預(yù)測(cè)每個(gè)圖塊的道路特征。這樣，它會(huì)自動(dòng)了解哪些圖像特征有用，以及如何沿圖傳播這些特征。例如，如果目標(biāo)圖塊具有不清晰的車(chē)道標(biāo)記，但是其相鄰圖塊具有四個(gè)具有清晰車(chē)道標(biāo)記的車(chē)道，并且共享相同的道路寬度，則目標(biāo)圖塊很可能也具有四個(gè)車(chē)道。在這種情況下，模型會(huì)自動(dòng)獲悉道路寬度是有用的圖像特征，因此，如果兩個(gè)相鄰的圖塊共享相同的道路寬度，

給定OpenStreetMap訓(xùn)練中未見(jiàn)的道路，該模型將道路分解為小塊，并使用其學(xué)習(xí)的權(quán)重進(jìn)行預(yù)測(cè)。該模型的任務(wù)是預(yù)測(cè)被遮擋的圖塊中的車(chē)道數(shù)量，該模型指出相鄰圖塊具有匹配的像素模式，因此共享信息的可能性很高。因此，如果這些圖塊具有四個(gè)車(chē)道，則被遮擋的圖塊也必須具有四個(gè)車(chē)道。

在另一個(gè)結(jié)果中，RoadTagger在合成的，極具挑戰(zhàn)性的道路中斷數(shù)據(jù)集中準(zhǔn)確預(yù)測(cè)了車(chē)道號(hào)。作為一個(gè)示例，具有兩個(gè)車(chē)道的立交橋覆蓋了具有四個(gè)車(chē)道的目標(biāo)道路的幾塊瓷磚。該模型檢測(cè)到立交橋的像素模式不匹配，因此它忽略了覆蓋圖塊上的兩條車(chē)道，準(zhǔn)確地預(yù)測(cè)了下面的四個(gè)車(chē)道。

研究人員希望使用RoadTagger來(lái)幫助人們快速驗(yàn)證并批準(zhǔn)對(duì)數(shù)據(jù)集(如OpenStreetMap)中基礎(chǔ)結(jié)構(gòu)的持續(xù)修改，其中許多地圖都不包含車(chē)道數(shù)或其他詳細(xì)信息。Bastani說(shuō)，一個(gè)特別感興趣的地區(qū)是泰國(guó)，那里的道路在不斷變化，但是數(shù)據(jù)集中幾乎沒(méi)有更新。

“曾經(jīng)被標(biāo)記為土路的道路已經(jīng)鋪好，所以最好繼續(xù)行駛，并且一些交叉路口已經(jīng)完全建成。每年都有變化，但是數(shù)字地圖已經(jīng)過(guò)時(shí)了。”他說(shuō)。“我們希望根據(jù)最新圖像不斷更新此類(lèi)道路屬性。”

標(biāo)簽：

免責(zé)聲明：本文由用戶上傳，如有侵權(quán)請(qǐng)聯(lián)系刪除！