|
|
توسعهی مدلهای هوشمصنوعی مبتنی بر ساختار مولکولی برای پیشبینی نقطه اشتعال آلکیلاسترها
|
|
|
|
|
نویسنده
|
حیدری زینب ,ثباتی محمدامین
|
منبع
|
همايش بين المللي هوش مصنوعي، علم داده و تحول ديجيتال در صنعت نفت و گاز - 1401 - دوره : 1 - همایش بین المللی هوش مصنوعی، علم داده و تحول دیجیتال در صنعت نفت و گاز - کد همایش: 01221-37478 - صفحه:0 -0
|
چکیده
|
یکی از رویکردهای جدید در پیش بینی خواص شیمی فیزیکی، توسعه مدل های ارتباط کمی ساختار-خاصیت (qspr) می باشد. در این روش که مبتنی بر داده کاوی و تکنیک های یادگیری ماشین می باشد، خاصیت مورد نظر به پارامترهای مولکولی مرتبط با ساختار شیمیایی مرتبط می شود. در این پژوهش دمای اشتعال 179 آلکیلاستر از ده خانواده شیمیایی متفاوت مورد آنالیز ارتباط کمی ساختار-خصوصیت قرار گرفت. برای توسعه مدلهای پیشبینی کننده دمای اشتعال، ابتدا جامعترین مجموعه داده ممکن از انواع آلکیل استرها از پایگاه داده خواص شیمی فیزیکی (dippr) جمعآوری شد. سپس، پس از رسم ساختار سهبعدی مولکول ها و بهینهسازی آنها، 3224 توصیفکننده مولکولی برای هر ساختار محاسبه شدند. در ادامه، با استفاده از روش جایگزینی بهبود یافته (erm) ، چهار توصیفکننده به عنوان مناسبترین توصیفکنندههای مولکولی مرتبط با نقطه اشتعال آلکیل استرها انتخاب شدند. سپس با کمک توصیفکنندههای منتخب، سه مدل یادگیری ماشین مبتنی بر برنامهریزی ژنتیکی، ماشین بردار پشتیبان و جنگل تصادفی برای ایجاد ارتباط بین دمای اشتعال و توصیفکنندهها توسعه یافتند. نتایج عملکرد مدلها بصورت پارامترهای آماری ضریب تعیین (r2)، جذر میانگین مربعات خطا (rmse)، میانگین خطای نسبی مطلق (aard%) گزارش شدند. نتیجه عملکرد بهترین مدل پیشبینیکننده (مدل برنامهریزی ژنتیکی) در قالب ضریب تعیین بترتیب روی مجموعه آموزش، تست و کل، 98/0، 97/0 و 98/0 گزارش شد.
|
کلیدواژه
|
دمای اشتعال، ارتباط کمی ساختار-خصوصیت(qspr)، آلکیل استرها، یادگیری ماشین، برنامهریزی ژنتیکی، ماشین بردار پشتیبان، جنگل تصادفی
|
آدرس
|
, iran, , iran
|
پست الکترونیکی
|
sobati@iust.ac.ir
|
|
|
|
|
|
|
|
|
Development of artificial intelligence structure-based models for prediction of flash point of alkyl esters
|
|
|
Authors
|
|
Abstract
|
One of the effective approaches which has been studied in recent years to predict physicochemical properties is the quantitative structure-property method (QSPR); in this method that is based on datamining and machine learning techniques, the main objective is to create a mathematical relationship between molecular structures and the studied property. In this study, new models based on quantitative structure-property relationship (QSPR) have been proposed for the prediction of flash point (FP) of different alkyl esters. In this regard, a comprehensive data set containing 179 alkyl esters from 10 categories were used for FP. The enhanced replacement method (ERM) was applied for choosing the appropriate molecular descriptors, and linear models were developed based on the selected descriptors. Nonlinear machine learning models were also developed for predicting FP using genetic programming (GP), support vector regression (SVR), and random forest regression (RFR). Then, the predictive performance of each model was evaluated through internal and external validation techniques considering several statistical parameters such as coefficient of determination (R2), root mean square error (RMSE), and percent of average absolute relative deviation (AARD%). The outcome of the validation techniques confirmed the satisfactory agreement between the predicted and experimental data. The R2 over the training, test, and total set was calculated as 0.98, 0.97, and 0.98 using the GP-based nonlinear model as the best model.
|
Keywords
|
Flash point ,QSPR ,Alkyl esters ,machine learning ,Genetic programming (GP) ,Support vector regression (SVR) ,Random Forest regression (RFR)
|
|
|
|
|
|
|
|
|
|
|