2016-2022 All Rights Reserved.平安財(cái)經(jīng)網(wǎng).復(fù)制必究 聯(lián)系QQ280 715 8082 備案號(hào):閩ICP備19027007號(hào)-6
本站除標(biāo)明“本站原創(chuàng)”外所有信息均轉(zhuǎn)載自互聯(lián)網(wǎng) 版權(quán)歸原作者所有。
近年來,諸如材料基因組計(jì)劃和材料項(xiàng)目等研究工作已經(jīng)產(chǎn)生了大量的計(jì)算工具,用于設(shè)計(jì)可用于從能源和電子到航空和土木工程等各種應(yīng)用的新材料。
但是,開發(fā)生產(chǎn)這些材料的過程仍然取決于經(jīng)驗(yàn),直覺和手工文獻(xiàn)綜述的結(jié)合。
麻省理工學(xué)院,馬薩諸塞大學(xué)阿默斯特分校和加州大學(xué)伯克利分校的一組研究人員希望通過新的人工智能系統(tǒng)來彌補(bǔ)材料 - 科學(xué)自動(dòng)化的差距,該系統(tǒng)將通過研究論文來推斷“食譜”。生產(chǎn)特殊材料。
“計(jì)算材料科學(xué)家在'制造什么'方面取得了很大進(jìn)展 - 根據(jù)所需特性設(shè)計(jì)了什么材料,”麻省理工學(xué)院材料科學(xué)與工程系(DMSE)大西洋里奇菲爾德能源研究助理教授Elsa Olivetti說。 )。“但是由于這種成功,瓶頸已經(jīng)轉(zhuǎn)移到了,'好吧,現(xiàn)在我該怎么做?'”
研究人員設(shè)想了一個(gè)數(shù)據(jù)庫,其中包含從數(shù)百萬篇論文中提取的材料配方。科學(xué)家和工程師可以輸入目標(biāo)材料的名稱和任何其他標(biāo)準(zhǔn) - 前體材料,反應(yīng)條件,制造工藝 - 并提取建議的配方。
作為實(shí)現(xiàn)這一愿景的一步,Olivetti和她的同事開發(fā)了一種機(jī)器學(xué)習(xí)系統(tǒng),可以分析研究論文,推斷其中哪些段落包含材料配方,并根據(jù)其在食譜中的作用對這些段落中的單詞進(jìn)行分類:目標(biāo)材料的名稱,數(shù)字量,設(shè)備名稱,操作條件,描述性形容詞等。
在最新一期“ 材料化學(xué) ”雜志上發(fā)表的一篇論文中,他們還證明機(jī)器學(xué)習(xí)系統(tǒng)可以分析提取的數(shù)據(jù),以推斷材料類別的一般特征 - 例如合成所需的不同溫度范圍 - 或者單個(gè)材料的特殊特征 - 例如當(dāng)它們的制造條件變化時(shí)它們將采取的不同物理形式。
Olivetti是該論文的高級(jí)作者,她與麻省理工學(xué)院DMSE研究生Edward Kim一同加入; Kevin Huang,DMSE博士后; 亞當(dāng)桑德斯和安大略麥卡勒姆,麻省大學(xué)阿默斯特分校的計(jì)算機(jī)科學(xué)家; 和Gerbrand Ceder,伯克利材料科學(xué)與工程系的校長,教授。
研究人員使用有監(jiān)督和無監(jiān)督的機(jī)器學(xué)習(xí)技術(shù)對他們的系統(tǒng)進(jìn)行訓(xùn)練。“監(jiān)督”是指供給系統(tǒng)的訓(xùn)練數(shù)據(jù)首先由人類注釋; 系統(tǒng)嘗試查找原始數(shù)據(jù)和注釋之間的相關(guān)性。“無監(jiān)督”意味著訓(xùn)練數(shù)據(jù)未被注釋,而系統(tǒng)則學(xué)習(xí)根據(jù)結(jié)構(gòu)相似性將數(shù)據(jù)聚集在一起。
由于材料配方提取是一個(gè)新的研究領(lǐng)域,Olivetti和她的同事們并沒有多年來由不同研究團(tuán)隊(duì)積累的大量注釋數(shù)據(jù)集。相反,他們必須自己注釋他們的數(shù)據(jù) - 最終,大約100篇論文。
通過機(jī)器學(xué)習(xí)標(biāo)準(zhǔn),這是一個(gè)非常小的數(shù)據(jù)集。為了改進(jìn)它,他們使用了Google開發(fā)的一種名為Word2vec的算法。Word2vec查看單詞出現(xiàn)的上下文 - 單詞'句子中的句法角色和圍繞它們的其他單詞 - 并將那些傾向于具有相似上下文的單詞組合在一起。因此,例如,如果一篇論文中包含句子“我們將四氯化鈦加熱到500℃”,另一篇文章中包含“氫氧化鈉被加熱到500℃”的句子,Word2vec會(huì)將“四氯化鈦”和“氫氧化鈉”分組。一起。
使用Word2vec,研究人員能夠極大地?cái)U(kuò)展他們的訓(xùn)練集,因?yàn)闄C(jī)器學(xué)習(xí)系統(tǒng)可以推斷附加到任何給定單詞的標(biāo)簽可能適用于與其聚集的其他單詞。因此,研究人員可以在大約640,000篇論文上訓(xùn)練他們的系統(tǒng),而不是100篇論文。
然而,為了測試系統(tǒng)的準(zhǔn)確性,他們不得不依賴標(biāo)記數(shù)據(jù),因?yàn)樗麄儧]有評估其在未標(biāo)記數(shù)據(jù)上的性能的標(biāo)準(zhǔn)。在這些測試中,系統(tǒng)能夠以99%的準(zhǔn)確度識(shí)別包含配方的段落,并以86%的準(zhǔn)確度標(biāo)記這些段落中的單詞。
研究人員希望進(jìn)一步的工作將提高系統(tǒng)的準(zhǔn)確性,并且在正在進(jìn)行的工作中,他們正在探索一系列深度學(xué)習(xí)技術(shù),這些技術(shù)可以進(jìn)一步概括材料配方的結(jié)構(gòu),目的是自動(dòng)設(shè)計(jì)材料配方中未考慮的材料配方?,F(xiàn)有文獻(xiàn)。
Olivetti之前的大部分研究都集中在尋找更具成本效益和環(huán)保能力的方法來生產(chǎn)有用的材料,她希望材料配方數(shù)據(jù)庫可以幫助該項(xiàng)目。
“這是具有里程碑意義的工作,”加州大學(xué)圣塔芭芭拉分校材料科學(xué)研究所Fred和Linda R. Wudl教授Ram Seshadri說道。“作者已經(jīng)采取了通過人工智能方法捕捉策略的艱難而雄心勃勃的挑戰(zhàn)用于準(zhǔn)備新材料。這項(xiàng)工作展示了機(jī)器學(xué)習(xí)的力量,但可以準(zhǔn)確地說,最終成功或失敗的判斷需要令人信服的從業(yè)者相信這些方法的效用可以使他們更加本能地放棄他們接近“。
這項(xiàng)研究得到了科學(xué)基金會(huì),海軍研究辦公室,能源部的支持以及通過麻省理工學(xué)院能源倡議的種子支持。Kim得到了加拿大自然科學(xué)和工程研究委員會(huì)的部分支持。
2016-2022 All Rights Reserved.平安財(cái)經(jīng)網(wǎng).復(fù)制必究 聯(lián)系QQ280 715 8082 備案號(hào):閩ICP備19027007號(hào)-6
本站除標(biāo)明“本站原創(chuàng)”外所有信息均轉(zhuǎn)載自互聯(lián)網(wǎng) 版權(quán)歸原作者所有。