2016-2022 All Rights Reserved.平安財經(jīng)網(wǎng).復(fù)制必究 聯(lián)系QQ280 715 8082 備案號:閩ICP備19027007號-6
本站除標(biāo)明“本站原創(chuàng)”外所有信息均轉(zhuǎn)載自互聯(lián)網(wǎng) 版權(quán)歸原作者所有。
許多人工智能研究都關(guān)注于找到變量之間的統(tǒng)計相關(guān)性:可見特征的哪些組合表明數(shù)字圖像中存在特定對象?什么語音與什么詞的實(shí)例相對應(yīng)?哪些醫(yī)學(xué),遺傳和環(huán)境因素與哪些疾病相關(guān)?
隨著變量數(shù)量的增加,計算它們的匯計數(shù)據(jù)變得非常復(fù)雜。但是,如果您對數(shù)據(jù)的結(jié)構(gòu)有所了解,那么這種計算可以大大簡化 - 例如,對應(yīng)于字母“T”的聲音后面經(jīng)常會出現(xiàn)與字母“R”相對應(yīng)的聲音,但絕不會是對應(yīng)于字母“Q”的聲音。
在12月份的神經(jīng)信息處理系統(tǒng)基金會年會上發(fā)表的一篇論文中,麻省理工學(xué)院的研究人員描述了一種新技術(shù),它擴(kuò)展了可以有效推導(dǎo)出結(jié)構(gòu)的數(shù)據(jù)集類。不僅如此,他們的技術(shù)自然地以一種使其更容易使用的方式描述數(shù)據(jù)。
在論文中,他們將他們的技術(shù)應(yīng)用于幾個樣本數(shù)據(jù)集,包括商業(yè)航班的信息。該算法僅使用航班的預(yù)定和實(shí)際出發(fā)時間,可以有效地推斷有關(guān)通過機(jī)場的航班延誤傳播的重要信息。它還確定了那些延誤最有可能產(chǎn)生深遠(yuǎn)影響的機(jī)場,這使得對整個網(wǎng)絡(luò)行為的推理變得更加簡單。
在技??術(shù)方面,研究人員的工作涉及概率圖形模型。在此上下文中,圖形是由節(jié)點(diǎn)和邊緣組成的數(shù)學(xué)構(gòu)造,通常分別描繪為圓形和連接它們的線條。網(wǎng)絡(luò)圖是一個熟悉的圖形示例; 家譜是另一種。
在圖形模型中,邊緣具有關(guān)聯(lián)的數(shù)字,其描述節(jié)點(diǎn)之間的統(tǒng)計關(guān)系。在語言示例中,表示對應(yīng)于“T”和“R”的聲音的節(jié)點(diǎn)將通過高度加權(quán)的邊緣連接,而對應(yīng)于“T”和“Q”的節(jié)點(diǎn)將根本不連接。
圖形模型簡化了數(shù)據(jù)關(guān)聯(lián)的推理,因?yàn)樗鼈兿丝紤]某些依賴關(guān)系的需要。例如,假設(shè)您的人工智能算法在大量醫(yī)療數(shù)據(jù)中尋找診斷上有用的模式,其中變量包括患者的癥狀,其遺傳信息,治療歷史和先前的診斷。沒有圖形結(jié)構(gòu),算法別無選擇,只能一次評估所有變量之間的關(guān)系。但是,如果它知道,例如,基因“G”是疾病“D”的原因,其用藥物“M”治療,其具有副作用“S”,那么它有一個更簡單的時間來確定是否,例如,“S”是先前未識別的“D”指示符。
從歷史上看,圖形模型只有在具有一些特定形狀(例如樹的形狀)時才加速機(jī)器學(xué)習(xí)算法。樹是一個沒有閉環(huán)的圖形:例如,在一個家族樹中,一個閉環(huán)表示生物學(xué)上不可能的東西 - 例如,某個人同時是同一個人的父母和兄弟。
麻省理工學(xué)院電氣工程與計算機(jī)科學(xué)系的研究生Ying Liu與他的顧問Alan Willsky共同編寫了這篇新論文,Edwin Sibley Webster電氣工程教授因?yàn)榭梢灾谱鹘y(tǒng)計推斷算法而產(chǎn)生問題。 Liu解釋說,通常用于推斷圖形模型中統(tǒng)計關(guān)系的算法是一種“消息傳遞算法,其中每個節(jié)點(diǎn)僅使用本地信息和來自其他鄰居的傳入消息向其鄰居發(fā)送消息。這是分配計算的一種非常好的方法。“
但是,如果圖形具有循環(huán),”節(jié)點(diǎn)可能會收到一些消息,但此消息部分來自其自身。所以它對這些信念過于自信。“
在之前的工作中,Liu和Willsky表明,高效的機(jī)器學(xué)習(xí)仍然可以在“循環(huán)”概率圖中發(fā)生,前提是它具有相對較小的“反饋頂點(diǎn)集”(FVS) - 一組節(jié)點(diǎn),其刪除將循環(huán)圖轉(zhuǎn)換為樹。在航空公司的航班示例中,F(xiàn)VS中的許多節(jié)點(diǎn)是航空樞紐,其中有飛往大量稀疏連接機(jī)場的航班。劉說,在目前應(yīng)用機(jī)器學(xué)習(xí)的其他環(huán)境中,可以看到相同的結(jié)構(gòu),例如社交網(wǎng)絡(luò)。
在新論文中,他們表明圖形模型的結(jié)構(gòu)可以通過類似的方法推導(dǎo)出來。無結(jié)構(gòu)數(shù)據(jù)集等效于每個節(jié)點(diǎn)連接到每個其他節(jié)點(diǎn)的圖。Liu和Willsky的算法遍歷圖表,依次刪除破壞循環(huán)的節(jié)點(diǎn),并使用他們之前演示的有效算法,計算結(jié)果圖的統(tǒng)計依賴性與完全連接圖的統(tǒng)計依賴性的接近程度。
以這種方式,算法為圖形建立FVS。剩下的是一棵樹 - 或者非常接近樹的東西 - 允許有效的計算。在實(shí)踐中,Liu和Willsky發(fā)現(xiàn),為了使機(jī)器學(xué)習(xí)有效,他們需要一個FVS,其大小只是圖中節(jié)點(diǎn)總數(shù)的對數(shù)。
德克薩斯大學(xué)奧斯汀分校電氣和計算機(jī)工程助理教授Sujay Sanghavi也研究了學(xué)習(xí)圖形模型結(jié)構(gòu)的問題。在麻省理工學(xué)院研究人員的工作中,Sanghavi說:“他們將問題分解為兩個問題,每個問題都可以單獨(dú)解決,然后在兩者之間交替。這是解決問題的一個更好的方法,而不是原來的問題。兩個問題混合在一起。“
在已經(jīng)確定FVS的情況下,Sanghavi說:“您可以輕松找到不包含這些節(jié)點(diǎn)的圖表。這是一個可愛的觀察,一旦你有這些節(jié)點(diǎn),問題的其余部分很容易。另一個問題也很簡單,也就是說,我只給你那些節(jié)點(diǎn),這些節(jié)點(diǎn)數(shù)量很少,你只需要找到那些有一個端點(diǎn)作為那些節(jié)點(diǎn)的邊。只是當(dāng)你試圖一起解決這兩個問題時,它變得很難。這是本文的主要見解,我覺得它非常好。“
Sanghavi最近一直在使用圖形模型來檢查基因調(diào)控網(wǎng)絡(luò)的結(jié)構(gòu),他很想知道MIT研究人員的技術(shù)是否適用于該問題。Sanghavi解釋說:“一些基因會激發(fā),它們會激發(fā)其他基因等等。” “你真正想要做的是找到基因之間的依賴網(wǎng)絡(luò),這可以被視為高斯圖形模型學(xué)習(xí)問題??纯此麄兊姆椒ㄊ欠癖憩F(xiàn)良好會很有趣。“
2016-2022 All Rights Reserved.平安財經(jīng)網(wǎng).復(fù)制必究 聯(lián)系QQ280 715 8082 備案號:閩ICP備19027007號-6
本站除標(biāo)明“本站原創(chuàng)”外所有信息均轉(zhuǎn)載自互聯(lián)網(wǎng) 版權(quán)歸原作者所有。