您的位置: 首頁 >科技 >

符號系統(tǒng)使科學(xué)家能夠更容易地傳達(dá)聚合物

2022-06-22 06:26:44 編輯:茅月行 來源:
導(dǎo)讀 具有緊湊但強大的基于結(jié)構(gòu)的分子結(jié)構(gòu)標(biāo)識符或表示系統(tǒng)是在研究界內(nèi)有效共享和傳播結(jié)果的關(guān)鍵促成因素。這些系統(tǒng)還為機器學(xué)習(xí)和其他數(shù)據(jù)驅(qū)

具有緊湊但強大的基于結(jié)構(gòu)的分子結(jié)構(gòu)標(biāo)識符或表示系統(tǒng)是在研究界內(nèi)有效共享和傳播結(jié)果的關(guān)鍵促成因素。這些系統(tǒng)還為機器學(xué)習(xí)和其他數(shù)據(jù)驅(qū)動的研究奠定了重要的基礎(chǔ)。雖然小分子已經(jīng)取得了實質(zhì)性進(jìn)展,但聚合物界一直在努力提出一種有效的代表系統(tǒng)。

對于小分子,基本前提是每種不同的化學(xué)物種對應(yīng)于明確定義的化學(xué)結(jié)構(gòu)。這不適用于聚合物。聚合物本質(zhì)上是隨機分子,通常具有化學(xué)結(jié)構(gòu)分布的集合體。這種困難限制了為小分子開發(fā)的所有確定性表示的適用性。在麻省理工學(xué)院,杜克大學(xué)和西北大學(xué)的研究人員9月12日發(fā)表的一篇論文中,麻省理工學(xué)院,杜克大學(xué)和西北大學(xué)的研究人員報告了一種新的表示系統(tǒng),該系統(tǒng)能夠處理聚合物的隨機性質(zhì),稱為BigSMILES。

“BigSMILES解決了聚合物數(shù)字表示方面的重大挑戰(zhàn),”Connor Coley博士解釋說。'19,該論文的共同作者。“聚合物幾乎總是通過隨機過程產(chǎn)生的多種化學(xué)結(jié)構(gòu)的集合體,因此我們不能使用相同的策略來記錄它們的結(jié)構(gòu),就像小分子一樣。”

共同作者是Coley; 麻省理工學(xué)院化學(xué)工程副教授Bradley D. Olsen; 華盛頓大學(xué)Karens F. Jensen化學(xué)工程教授Warren K. Lewis; 西北大學(xué)化學(xué)助理教授Julia A. Kalow; 麻省理工學(xué)院化學(xué)副教授Jeremiah A. Johnson; William T. Miller杜克大學(xué)化學(xué)教授Stephen L. Craig; 西北大學(xué)的研究生艾略特伍茲; 杜克大學(xué)研究生Zi Wang; 麻省理工學(xué)院的研究生王文聰; 麻省理工學(xué)院的研究生Haley K. Beech; 麻省理工學(xué)院訪問研究員Hidenobu Mochigase; 麻省理工學(xué)院的研究生Tzyy-Shyang Lin。

有幾種線符號可以傳達(dá)分子結(jié)構(gòu),簡化的分子輸入線路輸入系統(tǒng)(SMILES)是最受歡迎的。SMILES通常被認(rèn)為是人類最易讀的變體,迄今為止是最廣泛的軟件支持。在實踐中,SMILES提供了一組簡單的表示,適合作為化學(xué)數(shù)據(jù)的標(biāo)簽,也可作為研究人員之間數(shù)據(jù)交換的記憶緊湊型標(biāo)識符。作為基于文本的系統(tǒng),SMILES也很適合許多基于文本的機器學(xué)習(xí)算法。這些特性使SMILES成為將化學(xué)知識轉(zhuǎn)化為機器友好形式的完美工具,并已成功應(yīng)用于小分子特性預(yù)測和計算機輔助綜合規(guī)劃。

然而,聚合物已經(jīng)抵制了這種和其他結(jié)構(gòu)語言的描述。這是因為大多數(shù)結(jié)構(gòu)語言(如SMILES)都被設(shè)計用于描述明確定義的原子圖的分子或化學(xué)片段。由于聚合物是隨機分子,因此它們沒有獨特的SMILES表示。這缺乏聚合物材料的統(tǒng)一命名或標(biāo)識符約定是減緩聚合物信息學(xué)領(lǐng)域發(fā)展的主要障礙之一。雖然聚合物信息學(xué)的開創(chuàng)性工作,如聚合物基因組計劃,已證明SMILES擴展在聚合物信息學(xué)中的有用性,新化學(xué)的快速發(fā)展以及材料信息學(xué)和數(shù)據(jù)驅(qū)動研究的快速發(fā)展使得需要普遍適用聚合物的命名慣例很重要。

“機器學(xué)習(xí)為加速化學(xué)發(fā)展和發(fā)現(xiàn)提供了巨大的機會,”科學(xué)基金會(NSF)化學(xué)部代理副主任林鶴說。“這種用于標(biāo)記結(jié)構(gòu)的擴展工具,專門用于解決聚合物固有的獨特挑戰(zhàn),大大提高了化學(xué)結(jié)構(gòu)數(shù)據(jù)的可搜索性,使我們更接近利用數(shù)據(jù)革命。”

研究人員創(chuàng)造了一種新的基于結(jié)構(gòu)的構(gòu)造,作為非常成功的SMILES表示的補充,可以處理聚合物材料的隨機性質(zhì)。由于聚合物是高摩爾質(zhì)量分子,因此該構(gòu)建體被命名為BigSMILES。在BigSMILES中,聚合物片段由大括號括起來的重復(fù)單元列表表示。重復(fù)單元的化學(xué)結(jié)構(gòu)使用常規(guī)SMILES語法編碼,但具有額外的鍵合描述符,其指定不同的重復(fù)單元如何連接以形成聚合物。這種簡單的語法設(shè)計可以在大量不同的化學(xué)物質(zhì)上編碼大分子,包括均聚物,無規(guī)共聚物和嵌段共聚物,以及各種分子連接,從線性聚合物到環(huán)狀聚合物到甚至支化聚合物。與SMILES一樣,BigSMILES表示是緊湊的自包含文本字符串。

“使用BigSMILES標(biāo)準(zhǔn)化聚合物結(jié)構(gòu)的數(shù)字表示將鼓勵聚合物數(shù)據(jù)的共享和聚合,隨著時間的推移提高模型質(zhì)量并增強其使用的好處,”可再生化學(xué)品和材料開放式創(chuàng)新的材料主管Jason Clark說。 Braskem,與研究無關(guān)。“BigSMILES是該領(lǐng)域的重要貢獻(xiàn),因為它滿足了靈活系統(tǒng)以數(shù)字方式表示復(fù)雜聚合物結(jié)構(gòu)的需求。”

Clark補充說:“塑料行業(yè)在循環(huán)經(jīng)濟(jì)背景下面臨的挑戰(zhàn)始于原材料來源,并一直貫穿于報廢管理。應(yīng)對這些挑戰(zhàn)需要創(chuàng)新設(shè)計聚合物基材料傳統(tǒng)上經(jīng)歷了漫長的開發(fā)周期。人工智能和機器學(xué)習(xí)的進(jìn)步有望加速利用金屬合金和小有機分子的應(yīng)用的開發(fā)周期,促使塑料行業(yè)尋求平行的方法。BigSMILES數(shù)字表示通過應(yīng)用數(shù)據(jù)科學(xué)方法促進(jìn)了結(jié)構(gòu) - 性能關(guān)系的評估,他說,

“通過三個新的基本操作符和原始SMILES符號的組合,可以構(gòu)建多種復(fù)雜的聚合物結(jié)構(gòu),”Olsen說,“化學(xué),材料科學(xué)和工程的整個領(lǐng)域,包括聚合物科學(xué),生物材料,材料化學(xué)等等。生物化學(xué)是基于具有隨機結(jié)構(gòu)的大分子,這基本上可以被認(rèn)為是如何寫出大分子結(jié)構(gòu)的新語言。“

“我很興奮的事情之一是數(shù)據(jù)輸入最終可能與用于制造特定聚合物的合成方法直接相關(guān),”Craig說,“因此,有機會實際捕獲和處理更多有關(guān)分子的信息比通常從標(biāo)準(zhǔn)特征中獲得的信息。如果可以做到這一點,它將實現(xiàn)各種發(fā)現(xiàn)。“


免責(zé)聲明:本文由用戶上傳,如有侵權(quán)請聯(lián)系刪除!

最新文章

精彩推薦

圖文推薦

點擊排行

2016-2022 All Rights Reserved.平安財經(jīng)網(wǎng).復(fù)制必究 聯(lián)系QQ280 715 8082   備案號:閩ICP備19027007號-6

本站除標(biāo)明“本站原創(chuàng)”外所有信息均轉(zhuǎn)載自互聯(lián)網(wǎng) 版權(quán)歸原作者所有。