2016-2022 All Rights Reserved.平安財(cái)經(jīng)網(wǎng).復(fù)制必究 聯(lián)系QQ280 715 8082 備案號:閩ICP備19027007號-6
本站除標(biāo)明“本站原創(chuàng)”外所有信息均轉(zhuǎn)載自互聯(lián)網(wǎng) 版權(quán)歸原作者所有。
當(dāng)然,計(jì)算機(jī)可以用來玩大師級國際象棋(國際象棋計(jì)算機(jī)),但他們可以做出科學(xué)發(fā)現(xiàn)嗎?能源部勞倫斯伯克利實(shí)驗(yàn)室(伯克利實(shí)驗(yàn)室)的研究人員表明,沒有材料科學(xué)培訓(xùn)的算法可以掃描數(shù)百萬篇論文的文本并發(fā)現(xiàn)新的科學(xué)知識(shí)。
由伯克利實(shí)驗(yàn)室能源存儲(chǔ)和分布式資源部門的科學(xué)家Anubhav Jain領(lǐng)導(dǎo)的團(tuán)隊(duì)收集了330萬份已發(fā)表的材料科學(xué)論文摘要,并將其輸入一個(gè)名為Word2vec的算法中。通過分析單詞之間的關(guān)系,該算法能夠提前幾年預(yù)測新熱電材料的發(fā)現(xiàn),并建議尚未知的材料作為熱電材料的候選材料。
“沒有告訴任何有關(guān)材料科學(xué)的知識(shí),它就學(xué)會(huì)了周期表和金屬晶體結(jié)構(gòu)等概念,”Jain說。“這暗示了該技術(shù)的潛力。但可能是我們發(fā)現(xiàn)的最有趣的事情,你可以使用這種算法來解決材料研究中的差距,這是人們應(yīng)該研究但到目前為止還沒有研究過的東西。”
該研究結(jié)果發(fā)表在7月3日的“自然”雜志上。該研究的主要作者,“無監(jiān)督的詞匯嵌入材料科學(xué)文獻(xiàn)中捕獲潛在知識(shí)”,現(xiàn)為伯克利實(shí)驗(yàn)室博士后研究員Vahe Tshitoyan,現(xiàn)在在谷歌工作。與Jain一起,伯克利實(shí)驗(yàn)室的科學(xué)家Kristin Persson和Gerbrand Ceder幫助領(lǐng)導(dǎo)了這項(xiàng)研究。
“該文件確定科學(xué)文獻(xiàn)的文本挖掘可以發(fā)現(xiàn)隱藏的知識(shí),純文本提取可以建立基本的科學(xué)知識(shí),”Ceder說,他還在加州大學(xué)伯克利分校的材料科學(xué)與工程系任命。
Tshitoyan表示,該項(xiàng)目的動(dòng)機(jī)是難以理解大量已發(fā)表的研究。“在每個(gè)研究領(lǐng)域都有100年的研究文獻(xiàn),每周都有數(shù)十項(xiàng)研究出現(xiàn),”他說。“研究人員只能訪問其中的一小部分。我們認(rèn)為,機(jī)器學(xué)習(xí)能否以無人監(jiān)督的方式利用所有這些集體知識(shí),而無需人類研究人員的指導(dǎo)?”
'王后+男人=?'
該團(tuán)隊(duì)從1922年至2018年間在1000多種期刊上發(fā)表的論文中收集了330萬篇摘要.Word2vec在這些摘要中采用了大約500,000個(gè)不同的單詞,并將每個(gè)單詞轉(zhuǎn)換為200維向量,或200個(gè)數(shù)字的數(shù)組。
2016-2022 All Rights Reserved.平安財(cái)經(jīng)網(wǎng).復(fù)制必究 聯(lián)系QQ280 715 8082 備案號:閩ICP備19027007號-6
本站除標(biāo)明“本站原創(chuàng)”外所有信息均轉(zhuǎn)載自互聯(lián)網(wǎng) 版權(quán)歸原作者所有。