概述
目前人類雖然已掌握數(shù)以億計(jì)的分子數(shù)量,但也只占未知分子數(shù)目的一小部分,阻擋化學(xué)家發(fā)現(xiàn)未知分子的一個(gè)重要因素是缺乏分子的合成路線,而有機(jī)合成能夠?yàn)榛瘜W(xué)家們提供一種從簡(jiǎn)單結(jié)構(gòu)分子破碎重組合成復(fù)雜的分子的方法。在有機(jī)合成領(lǐng)域早期主要依靠化學(xué)家累計(jì)的經(jīng)驗(yàn)及制定的模板來進(jìn)行合成實(shí)驗(yàn),隨著分子機(jī)器學(xué)習(xí)中的生成模型逐漸成熟,用數(shù)據(jù)驅(qū)動(dòng)的方法應(yīng)對(duì)有機(jī)合成的挑戰(zhàn)成為當(dāng)下化學(xué)產(chǎn)品研究及研發(fā)的重要手段之一。
隨著人工智能技術(shù)日漸成熟,其在化學(xué)領(lǐng)域應(yīng)用優(yōu)勢(shì)也逐漸展現(xiàn)出來,有機(jī)合成預(yù)測(cè)就是其中之一。在傳統(tǒng)的化學(xué)實(shí)驗(yàn)室中,實(shí)驗(yàn)員想了解兩種分子的產(chǎn)物,必須通過真實(shí)的化學(xué)實(shí)驗(yàn)才能得到結(jié)果。而借助國工數(shù)據(jù)大腦平臺(tái)中有機(jī)合成算法,實(shí)驗(yàn)員僅通過簡(jiǎn)單的點(diǎn)擊就可以得到兩種分子反應(yīng)的多條預(yù)測(cè)結(jié)果,以供相關(guān)人員進(jìn)行參考。這不僅能夠節(jié)省時(shí)間成本,同時(shí)還能夠降低了相關(guān)的實(shí)驗(yàn)成本,及相關(guān)的實(shí)驗(yàn)風(fēng)險(xiǎn)。
平臺(tái)優(yōu)勢(shì)
國工數(shù)據(jù)大腦平臺(tái)是一個(gè)集成人工智能算法、統(tǒng)計(jì)學(xué)算法的數(shù)據(jù)分析平臺(tái),服務(wù)于傳統(tǒng)行業(yè)的智能化改造升級(jí)。經(jīng)過多年的積累,國工數(shù)據(jù)大腦平臺(tái)在數(shù)據(jù)、算法等方面具有明顯的優(yōu)勢(shì)。針對(duì)于有機(jī)合成預(yù)測(cè)算法,其主要優(yōu)勢(shì)如下:
第一,集成于國工數(shù)據(jù)大腦平臺(tái),降低了該算法的使用門檻,使用者僅需輸入?yún)⑴c反應(yīng)的SMILES代碼即可;具有較快的運(yùn)行速度,可以快速響應(yīng)用戶的需求;
第二,建模數(shù)據(jù)規(guī)模龐大,主要得益于國工智能在化工行業(yè)深耕多年,慢慢積累得來;
第三,采用transformer AI技術(shù)框架進(jìn)行訓(xùn)練,克服對(duì)既有經(jīng)驗(yàn)以及模板庫的依賴,同時(shí)擁有較高的預(yù)測(cè)準(zhǔn)確率;
第四,數(shù)據(jù)、模型可信度高,每條數(shù)據(jù)均出自于相關(guān)專利文獻(xiàn),并且模型的預(yù)測(cè)線路均參考相關(guān)文獻(xiàn)專利;
第五,多條預(yù)測(cè)線路展示,該算法可以為每個(gè)預(yù)測(cè)線路進(jìn)行可靠性計(jì)算,并按照可靠性高低展示給用戶。
預(yù)測(cè)過程
首先,打開國工數(shù)據(jù)大腦平臺(tái)。依次進(jìn)行操作:機(jī)器學(xué)習(xí)-->工作臺(tái)—>新建正向合成計(jì)算流程—>拉取正向合成組件(圖1)
圖1
然后,進(jìn)行組件配置。資源項(xiàng)選擇正向合成云服務(wù),分子式填入?yún)⑴c反應(yīng)的相關(guān)反應(yīng)的SMILES表達(dá)式,并按照相應(yīng)規(guī)則填入,如圖2所示。最后點(diǎn)擊調(diào)試,當(dāng)顯示運(yùn)行成功時(shí)即表示運(yùn)行預(yù)測(cè)算法成功,平臺(tái)會(huì)將預(yù)測(cè)結(jié)果展現(xiàn)給用戶,結(jié)果如圖3所示。
圖2
分析結(jié)果
圖3
如圖3所示,數(shù)據(jù)大腦平臺(tái)運(yùn)行預(yù)測(cè)算法可以同時(shí)得到多條預(yù)測(cè)結(jié)果,以供實(shí)驗(yàn)人員進(jìn)行參考。同時(shí)其排序順序則是按照算法預(yù)測(cè)結(jié)果的可靠性計(jì)算后展示給用戶。
其中每條結(jié)果都是由參與反應(yīng)的反應(yīng)分子的分子結(jié)構(gòu)圖及其SMILES表達(dá)式與預(yù)測(cè)生成物的SMILES的分子結(jié)構(gòu)圖及其SMILES表達(dá)式共同組成。分子結(jié)構(gòu)圖可以幫助實(shí)驗(yàn)人員快速的定位到發(fā)生反應(yīng)的官能團(tuán),以及具體的化學(xué)鍵的斷裂與重組的情況。依據(jù)以上信息以及其本身的經(jīng)驗(yàn),實(shí)驗(yàn)人員可以分析出分子間結(jié)合反應(yīng)的合理性,并以此作為該反應(yīng)是否保留進(jìn)行真實(shí)實(shí)驗(yàn)的依據(jù)。通過使用國工數(shù)據(jù)大腦的正向合成服務(wù),可以有效的幫助實(shí)驗(yàn)人員節(jié)省時(shí)間以及實(shí)驗(yàn)成本,加快研發(fā)的效率。是學(xué)術(shù)、研發(fā)人手必備的科研利器。
名詞解釋
SMILES表達(dá)式:全稱Simplified molecular input line entry system,是一種簡(jiǎn)化分子線性輸入規(guī)范,一種用ASCII字符串明確描述分子結(jié)構(gòu)的規(guī)范。
分子式填入規(guī)則:反應(yīng)分子的SMILES表達(dá)式中間由“.”進(jìn)行隔開。
適用范圍
有機(jī)合成預(yù)測(cè)應(yīng)用場(chǎng)景:各大化學(xué)研發(fā)中心的小分子研發(fā)實(shí)驗(yàn)室,以及各高校化學(xué)研究實(shí)驗(yàn)室。
6月9日,第八屆煙臺(tái)國工智能科技有限公司AI研究院“AI課題文獻(xiàn)綜述分享茶歇會(huì)”成功舉辦。本次會(huì)議聚焦“基于遺傳算法的高分子配方設(shè)計(jì)方法”,通過前沿技術(shù)分享與案例解析,展現(xiàn)了國工智能在AI+材
精餾回收工藝是醫(yī)藥化工行業(yè)中的最為重要的典型單元操作之一,在原料藥、精細(xì)化工、輕工業(yè)等各個(gè)領(lǐng)域都有極其廣泛的應(yīng)用。由于精餾過程的復(fù)雜性,精餾工藝過程的終點(diǎn)現(xiàn)階段仍需要生產(chǎn)工人每隔一定時(shí)間取樣送實(shí)驗(yàn)室檢測(cè),通過氣相色譜測(cè)定含量,卡爾費(fèi)休滴定法
中秋節(jié)是中國傳統(tǒng)節(jié)日之一,也是一年中最重要、最盛大的節(jié)日之一。在這一天,以明亮的月亮和家人團(tuán)聚為特點(diǎn),承載著人們無盡的思念和美好的祝福。 國慶、中秋兩節(jié)遇, 合家團(tuán)圓精神俱。 團(tuán)團(tuán)圓圓過中秋, 歡歡喜喜
2023年8月28日,國工智能與鎂伽科技舉行戰(zhàn)略合作簽約儀式,國工智能董事長(zhǎng)柳彥宏與鎂伽科技創(chuàng)始人兼首席執(zhí)行官黃瑜清先生代表雙方簽訂正式戰(zhàn)略合作協(xié)議,標(biāo)志著AI輔助化工研發(fā)領(lǐng)先者、智能自動(dòng)化實(shí)驗(yàn)室引領(lǐng)者開啟強(qiáng)強(qiáng)聯(lián)合發(fā)展之路。&n