|
|
ارائه مدلی کارآمد بهمنظور پیشبینی پپتیدهای ضدمیکروبی با استفاده از الگوریتمهای هوش مصنوعی
|
|
|
|
|
نویسنده
|
رسانی مهین ,کرمی کیوان ,نصیری محمدرضا ,طهمورث پور مجتبی ,سخاوتی محمد هادی
|
منبع
|
بيوتكنولوژي كشاورزي - 1403 - دوره : 16 - شماره : 3 - صفحه:89 -110
|
چکیده
|
هدف: هدف از انجام این تحقیق پیشنهاد یک الگوریتم کارآمد بهمنظور پیشبینی پپتیدهای ضدمیکروبی با استفاده از الگوریتمهای هوش مصنوعی میباشد.مواد و روشها: در این تحقیق، ابتدا یک مجموعه داده پپتیدهای ضدمیکروبی و پپتیدهای فاقد فعالیت ضدمیکروبی به روز شامل ویژگیهای فیزیکوشیمیایی در سطح اسیدهای آمینه و توالی پروتئین در سه گونه حیوانی و انسان استخراج گردید. پس از کاوش دادهها و مراحل پیشپردازش داده، چهار روش یادگیری با نظارت شامل الگوریتم درخت تصمیمگیری ، الگوریتم جنگل تصادفی، الگوریتم بیز ساده و الگوریتم ماشین بردار پشتیبان بر روی مجموعه داده پپتیدهای ضدمیکروبی و پپتیدهای فاقد فعالیت ضدمیکروبی با اعتبارسنجی متقابل 10 برابری برای ساخت مدلها و پیشبینی برچسب پپتیدهای ضدمیکروبی با استفاده از معیارهای ارزیابی اختصاصی بودن، حساسیت، نرخ صحت، معیار دقیق بودن، نرخ کامل بودن، معیار اف و سطح زیر منحنی راک ارزیابی گردید.نتایج: در این تحقیق با استفاده از یک مجموعه داده بهروز، یک مدل یادگیری ماشین. با موفقیت برای پیشبینی پپتیدهای ضدمیکروبی آموزش داده شده است. مجموعه جامعی از ویژگیهای تحت انتخاب ویژگی قرار گرفتهاند تا ویژگیهای کلیدی پپتیدهای ضدمیکروبی را شناسایی کنند. پس از انتخاب ویژگی، در میان مدلهای مختلف تولید شده، مدل مبتنی بر طبقهبندی کننده مدل جنگلتصادفی با نرخ صحت (95 درصد)، معیاردقیق بودن (96 درصد)، نرخ کامل بودن (95 درصد) و معیار اف (95 درصد)، بهترین عملکرد را نشان داد. از چهار الگوریتم دستهبندی، الگوریتم جنگل تصادفی و ماشین بردار پشتیبان بیشترین دقت را دارند. و الگوریتم دستهبند درخت تصمیمگیری کمترین دقت را داشت.نتیجهگیری: با توجه به نتایج به دست آمده مدل پیشنهادی جنگل تصادفی عملکرد بهتری نسبت به سایر مدلها برای پیشبینی پپتیدهای ضدمیکروبی دارد، این مدل برخی از پپتیدها را بهعنوان پپتید با خاصیت ضدمیکروبی پیشبینی کردند. این رویکرد پیشبینی میتواند در استخراج پپتیدهای ضدمیکروبی از کتابخانههای پپتیدهای ضدمیکروبی در کاربردهای بالینی مفید قبل از حرکت به مطالعات تجربی مفید باشد. از سوی دیگر، چندین ویژگی در ویژگیهای انتخابی نهایی نشان میدهد که این ویژگیها تعیینکننده حیاتی خواص پپتیدها هستند و باید در توسعه مدلهایی برای پیشبینی فعالیت پپتیدها در نظر گرفته شوند. کد اجرایی در فایل پیوست موجود است.
|
کلیدواژه
|
الگوریتمهای یادگیری ماشین، پپتیدهای ضدمیکروبی، سطح زیر منحنیهای مشخصه عملکرد گیرنده، ماتریس درهمریختگی
|
آدرس
|
دانشگاه فردوسی مشهد, دانشکده کشاورزی, گروه علوم دامی, ایران, دانشگاه فردوسی مشهد, دانشکده کشاورزی, گروه علوم دامی, ایران, دانشگاه فردوسی مشهد, دانشکده کشاورزی, گروه علوم دامی, ایران, دانشگاه فردوسی مشهد, دانشکده کشاورزی, گروه علوم دامی, ایران, دانشگاه فردوسی مشهد, دانشکده کشاورزی, گروه علوم دامی, ایران
|
پست الکترونیکی
|
sekhavati@um.ac.ir
|
|
|
|
|
|
|
|
|
providing an efficient model to predict antimicrobial peptides using artificial intelligence algorithms
|
|
|
Authors
|
rasani mahin ,karami keyvan ,nassiri mohammadreza ,tahmorthpour mojtabi ,sekhavati mohammad hadi
|
Abstract
|
objectivethe aim of this study was to propose an efficient algorithm to predict antimicrobial peptides using artificial intelligence algorithms.materials and methodsin this study, an updated amp and non-amp data set including physico-chemical characteristics at the level of amino acids and protein sequence in three animal species and humans was extracted. after data exploration and data pre-processing steps, four methods supervised learning including decision tree, random forest, naive bayes and svm on the amp dataset with 10-fold cross-validation to build models and predict the amp label using the evaluation criteria of specificity, sensitivity, rate accuracy, precision, recall, f1 score and area under the rock curve (auc) were evaluated.resultsin this study, using an up-to-date dataset, a machine learning model has been successfully trained to predict antimicrobial peptides. a comprehensive set of features has been subjected to feature selection to identify key features of antimicrobial peptides. after selecting the feature, among the different generated models, the model based on the rf model classifier showed the best performance with accuracy (95 percent), precision (96 percent), recall (95 percent), f1 score (95 percent). the four classification of algorithms, random forest algorithm and svm are the most accurate. the decision tree classification algorithm had the least accuracy.conclusionsaccording to the obtained results, the proposed rf model has a better performance than other models for amp prediction. this model predicted some peptides as peptides with antimicrobial properties. this predictive approach can be useful in extracting amps with antimicrobial properties from amp libraries in useful clinical applications before moving on to experimental studies. on the other hand, several features in the final selection properties indicate that these features are critical determinants of peptide properties and should be considered in the development of models to predict peptide activity. the executable code is available in the attached file.
|
Keywords
|
machine learning algorithms ,antimicrobial peptides ,area under the rock curve ,confusion matrix
|
|
|
|
|
|
|
|
|
|
|