>
Fa   |   Ar   |   En
   شناسایی باکتری های مقاوم به گرما بر اساس انتخاب بازنمایی مناسب از توالی پروتئین با استفاده از رویکرد یادگیری عمیق  
   
نویسنده احسن رضا ,ابراهیمی منصور
منبع مجله دانشگاه علوم پزشكي قم - 1399 - دوره : 14 - شماره : 3 - صفحه:54 -63
چکیده    زمینه و هدف: شناسایی مکانیزم های موثر در مقاومت باکتری ها به گرما جهت ایجاد سویه های مقاوم به گرما در صنایعی از جمله صنایع غذایی، ساخت منسوجات و به خصوص در صنایع تولیدکننده مواد شوینده، بسیار حائز اهمیت می باشد. به این منظور، از ابزارهای یادگیری عمیق برای شناسایی خصوصیات باکتری های مقاوم به گرما بر اساس خصوصیات پروتئینی استفاده گردید.روش بررسی: برخی از خصوصیات پروتئین های مقاوم و غیر مقاوم به گرما از قبیل ویژگی& های ساختاری اسیدآمینه ها، تعداد و فرکانس هر اسیدآمینه و خصوصیات فیزیکوشیمیایی آنها محاسبه گردیدند. مجموعه داده ها جهت رده& بندی باکتری ها، در سه مرحله انجام شد: ابتدا از مدل های وزن دهی برای شناسایی متغیرهای مهم استفاده شده و سپس آنها انتخاب شده و نهایتا با استفاده از شبکه یادگیری عمیق نسبت به استخراج سلسله مراتب ویژگی& ها اقدام گردید.یافته ها: نتایج ده روش وزن دهی نشان دادند که از بین 73 خصوصیات تعداد و فرکانس اسیدهای آمینه، تنها 40 ویژگی، وزن بالاتر از صفر داشتند. از این تعداد، 13 ویژگی، وزن بالاتر از 0.5 را کسب کرده و تنها 10 ویژگی میانگین وزن اختصاص داده به آنها بالاتر از 0.09 بوده است. این ده ویژگی به عنوان متغیرهای مهم انتخاب شدند. ویژگی& های فرکانس گلوتامین و فرکانس اسیدگلوتامیک بیشترین وزن را اخذ کرده و به عنوان دو خصوصیت مهم در رده بندی باکتری های مقاوم و غیرمقاوم به گرما معرفی شدند. بیشترین دقت رده& بندی باکتری& های مقاوم به گرما در رویکرد سوم برابر 92.42% بدست آمد.نتیجه گیری: شبکه های عصبی عمیق با استخراج سلسله مراتب ویژگی ها، می تواند به خوبی باکتری های مقاوم به گرما را بر اساس خصوصیات پروتئینی آنها شناسایی کند.
کلیدواژه مقاوم به گرما، توالی پروتئین، رده‌بندی، یادگیری عمیق
آدرس دانشگاه قم, دانشکده فنی و مهندسی, ایران, دانشگاه قم, دانشکده علوم پایه, گروه زیست‌شناسی, ایران
پست الکترونیکی mansour@future.edu
 
   Identification of HeatResistant Bacteria Based on Selection of Proper Representation of Protein Sequences Using Deep Learning Approach  
   
Authors Ahsan Reza ,Ebrahimi Mansour
Abstract    Background and Objectives: Identification of effective mechanisms in heatresistance in bacteria is of great importance in some industries, such as food industry, textile manufacturing, and especially in detergent production industries. For this purpose, deep learning tools were used to identify the characteristics of heatresistant bacteria based on protein properties. Methods: Some characteristics of heatresistant and nonheatresistant proteins, such as the structural properties of amino acids, the number and the frequency of each amino acid, and their physicochemical properties, were calculated. Bacterial classification was performed in three steps: first, attribute weighting methods were used to select the important variables, then those variables, were selected and finally deep learning networks were employed to extract the hierarchy of the features. Results: The results of 10 weighting methods showed that out of 73 characteristics of the number and frequency of amino acids, only 40 had weights higher than zero. Of these variables, 13 variable gained weight higher than 0.5 and only 10 variables had weight above 0.09. These 10 features were selected as important variables. The frequencies of glutamine and glutamic acid obtained the highest possible weights and were considered as two important features in the classification of heatresistant and nonheatresistant bacteria. The highest prediction accuracy of the deep learning networks was 92.42% for the classification of heat resistant bacteria. Conclusion: The deep neural networks can be effectively used to identify heatresistant bacteria based on their protein properties.
Keywords Thermostable ,Protein sequence ,Classification ,Deep learning networks.
 
 

Copyright 2023
Islamic World Science Citation Center
All Rights Reserved