>
Fa   |   Ar   |   En
   ارائه مدلی کارآمد به‏‏منظور پیش‏بینی پپتیدهای ضدمیکروبی با استفاده از الگوریتم‌های هوش مصنوعی  
   
نویسنده رسانی مهین ,کرمی کیوان ,نصیری محمدرضا ,طهمورث پور مجتبی ,سخاوتی محمد هادی
منبع بيوتكنولوژي كشاورزي - 1403 - دوره : 16 - شماره : 3 - صفحه:89 -110
چکیده    هدف: هدف از انجام این تحقیق پیشنهاد یک الگوریتم کارآمد به‏‏منظور پیش‏بینی پپتیدهای ضد‏میکروبی با استفاده از الگوریتم‌های هوش‏ مصنوعی می‌باشد.مواد و روش‌ها: در این تحقیق، ابتدا یک مجموعه داده پپتیدهای ضدمیکروبی و پپتیدهای فاقد فعالیت ضد‏میکروبی به ‌روز شامل ویژگی‌های فیزیکو‏شیمیایی در سطح اسیدهای آمینه و توالی پروتئین در سه گونه حیوانی و انسان استخراج گردید. پس از کاوش داده‌ها و مراحل پیش‏پردازش داده، چهار روش یادگیری با نظارت شامل الگوریتم درخت تصمیم‏گیری ، الگوریتم جنگل تصادفی، الگوریتم بیز ساده و الگوریتم ماشین بردار پشتیبان بر روی مجموعه داده پپتیدهای ضدمیکروبی و پپتیدهای فاقد فعالیت ضد‏میکروبی با اعتبارسنجی متقابل 10 برابری برای ساخت مدل‌ها و پیش‏بینی برچسب پپتیدهای ضدمیکروبی با استفاده از معیارهای ارزیابی اختصاصی‏ بودن، حساسیت، نرخ صحت، معیار دقیق بودن، نرخ کامل بودن، معیار اف و سطح زیر منحنی راک ارزیابی گردید.نتایج: در این تحقیق با استفاده از یک مجموعه داده به‏‌روز، یک مدل یادگیری ماشین. با موفقیت برای پیش‌بینی پپتیدهای ضد‏میکروبی آموزش داده شده است. مجموعه جامعی از ویژگی‌های تحت انتخاب ویژگی قرار گرفته‌اند تا ویژگی‌های کلیدی پپتیدهای ضد‏میکروبی را شناسایی کنند. پس از انتخاب ویژگی، در میان مدل‌های مختلف تولید شده، مدل مبتنی بر طبقه‌بندی کننده مدل جنگل‏‏تصادفی با نرخ صحت (95 درصد)، معیاردقیق بودن (96 درصد)، نرخ کامل بودن (95 درصد) و معیار اف (95 درصد)، بهترین عملکرد را نشان داد. از چهار الگوریتم دسته‏بندی، الگوریتم جنگل تصادفی و ماشین بردار پشتیبان بیشترین دقت را دارند. و الگوریتم دسته‏بند درخت تصمیم‏گیری کمترین دقت را داشت.نتیجه‌گیری: با توجه به نتایج به ‏دست آمده مدل پیشنهادی جنگل تصادفی عملکرد بهتری نسبت به سایر مدل‌ها برای پیش‏بینی پپتیدهای ضد‏میکروبی دارد، این مدل برخی از پپتیدها را به‏عنوان پپتید با خاصیت ضد‏میکروبی پیش‏‌بینی کردند. این رویکرد پیش‌بینی می‌تواند در استخراج پپتیدهای ضد‏میکروبی از کتابخانه‌های پپتیدهای ضد‏میکروبی در کاربردهای بالینی مفید قبل از حرکت به مطالعات تجربی مفید باشد. از سوی دیگر، چندین ویژگی در ویژگی‌های انتخابی نهایی نشان می‌دهد که این ویژگی‌ها تعیین‌کننده حیاتی خواص پپتیدها هستند و باید در توسعه مدل‌هایی برای پیش‌بینی فعالیت پپتیدها در نظر گرفته شوند. کد اجرایی در فایل پیوست موجود است.
کلیدواژه الگوریتم‌های یادگیری ماشین، پپتیدهای ضد‏‏میکروبی، سطح زیر منحنی‌های مشخصه عملکرد گیرنده، ماتریس درهم‏ریختگی
آدرس دانشگاه فردوسی مشهد, دانشکده کشاورزی, گروه علوم دامی, ایران, دانشگاه فردوسی مشهد, دانشکده کشاورزی, گروه علوم دامی, ایران, دانشگاه فردوسی مشهد, دانشکده کشاورزی, گروه علوم دامی, ایران, دانشگاه فردوسی مشهد, دانشکده کشاورزی, گروه علوم دامی, ایران, دانشگاه فردوسی مشهد, دانشکده کشاورزی, گروه علوم دامی, ایران
پست الکترونیکی sekhavati@um.ac.ir
 
   providing an efficient model to predict antimicrobial peptides using artificial intelligence algorithms  
   
Authors rasani mahin ,karami keyvan ,nassiri mohammadreza ,tahmorthpour mojtabi ,sekhavati mohammad hadi
Abstract    objectivethe aim of this study was to propose an efficient algorithm to predict antimicrobial peptides using artificial intelligence algorithms.materials and methodsin this study, an updated amp and non-amp data set including physico-chemical characteristics at the level of amino acids and protein sequence in three animal species and humans was extracted. after data exploration and data pre-processing steps, four methods supervised learning including decision tree, random forest, naive bayes and svm on the amp dataset with 10-fold cross-validation to build models and predict the amp label using the evaluation criteria of specificity, sensitivity, rate accuracy, precision, recall, f1 score and area under the rock curve (auc) were evaluated.resultsin this study, using an up-to-date dataset, a machine learning model has been successfully trained to predict antimicrobial peptides. a comprehensive set of features has been subjected to feature selection to identify key features of antimicrobial peptides. after selecting the feature, among the different generated models, the model based on the rf model classifier showed the best performance with accuracy (95 percent), precision (96 percent), recall (95 percent), f1 score (95 percent). the four classification of algorithms, random forest algorithm and svm are the most accurate. the decision tree classification algorithm had the least accuracy.conclusionsaccording to the obtained results, the proposed rf model has a better performance than other models for amp prediction. this model predicted some peptides as peptides with antimicrobial properties. this predictive approach can be useful in extracting amps with antimicrobial properties from amp libraries in useful clinical applications before moving on to experimental studies. on the other hand, several features in the final selection properties indicate that these features are critical determinants of peptide properties and should be considered in the development of models to predict peptide activity. the executable code is available in the attached file.
Keywords machine learning algorithms ,antimicrobial peptides ,area under the rock curve ,confusion matrix
 
 

Copyright 2023
Islamic World Science Citation Center
All Rights Reserved