>
Fa   |   Ar   |   En
   طبقه‌‎بندی پیش‌‎سازهای microrna در گاو (bos taurus) با استفاده از ویژگی‎‌های کاهش یافته تکرارهای دو نوکلئوتیدی  
   
نویسنده سیددخت عاطفه ,رحمانی‌نیا جواد ,کرمی حسن
منبع پژوهشهاي توليدات دامي - 1402 - دوره : 14 - شماره : 41 - صفحه:33 -44
چکیده    مقدمه و هدف: توسعه مداوم فناوری‌های مولکولی مورد استفاده برای تجزیه و تحلیل رونوشت‌ها، به‌ویژه فناوری‌های توالی‌یابی نسل بعدی و ابزارهای پیشرفته بیوانفورماتیک، امکان کاوش عمیق‌تر rnaهای پیام‌رسان (mrnas) و rna‎های غیرکد کننده (ncrna) از جمله mirna‎ها را فراهم می‌کند. این فناوری‌ها فرصت‌های بزرگی را برای اکتشاف عمیق‌تر دخالت mirna‎ها در بیماری‌های حیوانات مزرعه و همچنین بهره‌وری و رفاه دام ارائه نمودند. از زمان کشف lin-4 و let‑7، هزاران mirna در گونه‌های حیوانات مزرعه شناسایی و در پایگاه‌های داده mirna ثبت شده‌اند. mirna‎ها را می‎توان به‎عنوان نشانگرهای زیستی، اهداف تشخیصی، پیش‎آگهی و درمانی برای مدیریت بیماری‎های دام استفاده کرد. با تعیین توالی ژنوم گاو (bos taurus)، فرصتی برای کشف mirna‎های جدید در این گونه فراهم خواهد شد. از آنجایی‎که تعیین توالی و ساختار mirna ها به‎صورت آزمایشگاهی هزینه‎بر و زمان‎بر است، بنابراین این پژوهش با هدف استفاده از روش‎های محاسباتی مبتنی بر یادگیری ماشین به‎‎منظور پیش‌بینی microrna‎ها در ژنوم گاو انجام شد.مواد و روش‎ها: یافتن روشی دقیق برای شناسایی مولکول‎های mirna می‎تواند به درک فرآیندهای تنظیمی کمک کند. در حال حاضر روش‌های محاسباتی مبتنی بر الگوریتم‌های یادگیری به‎طور گسترده برای پیش‌بینی mirna‎ها استفاده می‌ شوند. با الهام از سایر تحقیقات انجام شده در زمینه شناسایی mirna‎ها، یک مدل محاسباتی بهبود یافته یادگیری ماشین برای شناسایی توالی‎های پیش‎ساز mirna‎های واقعی (pre-mirna) پیشنهاد شد. در مرحله اول فراوانی توالی‎های دو نوکلئوتیدی ژن‌های pre-mirna و محتوای بازهای سیتوزین و گوانین (g+c) در توالی ها در نظر گرفته شد. ترکیب دی نوکلئوتیدی مشاهده شده به‎عنوان ویژگی های ساختاری ترکیب توالی برای هر ژن mirna محاسبه شد. مجموع ترکیبات دو نوکلئوتیدی در گونه گاو (bos taurus) با محتویات ژنومی g+c برای 1064 توالی mirna و توالی های غیر mirna محاسبه شد. در مرحله بعد دو مدل طبقه‌بندی مبتنی بر رویکرد یادگیری ماشین برای شناسایی pre-mirna های واقعی و شبه واقعی آموزش داده شدند. مجموعه ای از 17 ویژگی بهینه شده مربوط به ساختارهای توالی برای آموزش مدل‎ها استفاده شد. این مدل‌ها با روش اعتبارسنجی متقاطع 10 تایی آموزش یافتند و اعتبارسنجی شدند.یافته‌ ها: هدف بررسی عملکرد پیش‌بینی طبقه‌بندی کننده‎ها براساس ویژگی‌های rna در تشخیص  pre-mirnaها از سایر توالی‎ها بود. مدل آنالیز شده در این پژوهش با استفاده از مجموعه داده‎های گاو (bos taurus) به‎دقت 99 درصد و ضریب همبستگی متیو 97/9 درصد دست یافت.نتیجه‎گیری: روش‌های محاسباتی هوش مصنوعی می‌توانند mirnaهای بالقوه جدیدی را در ژنوم گاو شناسایی کنند که برخی از آنها قبلاً در این ژنوم شناسایی نشده بودند. در نتیجه لزوم استفاده از روش‌های محاسباتی جهت شناسایی این rnaهای تنظیمی در دام‌ها جهت اهداف اصلاحی ضروری به‌منظر می‌رسد. نتایج این پروژه نشان داد که تنها با استفاده از ویژگی‎های ساختاری دو نوکلئوتیدی می‎توان در پیش‎بینی توالی‎های mirna به‎دقت بالایی دست یافت.
کلیدواژه بیوانفورماتیک، شناسایی محاسباتی، گاو (bos taurus)، یادگیری ماشینی، mirna
آدرس سازمان تحقیقات، آموزش و ترویج کشاورزی, مرکز تحقیقات و آموزش کشاورزی و منابع طبیعی استان خراسان رضوی, بخش تحقیقات علوم دامی, ایران, سازمان تحقیقات، آموزش و ترویج کشاورزی, موسسه تحقیقات علوم دامی کشور, ایران, سازمان تحقیقات، آموزش و ترویج کشاورزی, موسسه تحقیقات علوم دامی کشور, ایران
پست الکترونیکی hkarami7515@gmail.com
 
   classification of microrna precursors using reduced features of dinucleotide repeats in cattle (bos taurus)  
   
Authors seyeddokht atefeh ,rahmaninia javad ,karami hasan
Abstract    introduction and objective: the latest major advances in transcriptomics technologies, especially next-generation sequencing technologies and advanced bioinformatics tools, allows deeper exploration of messenger rnas (mrnas) and non-coding rnas (ncrnas), including mirnas. these technologies have offered important chance for a deeper study of mirna association in farm animal diseases, as well as livestock productivity and welfare. since the discovery of lin‑4 and let‑7, many micrornas have been identified in farm animal species and deposited in mirna databases. mirna can be used as biomarkers in the context of farm animal disease diagnostics, prediction, and therapeutic purposes, for the management of livestock diseases. by the sequencing of bos taurus (cattle) genome, we have an opportunity to discover novel mirnas in this species. however, the experimental determination of mirna sequence and structure is both expensive and time-consuming, therefore, computational and machine learning-based approaches have been adopted to predict novel micrornas in the bos taurus (cattle) genome.material and methods: finding an accurate method for identification of mirna molecules can help for understanding of regulatory processes. currently, computational methods based on learning algorithms have been extensively applied for mirna prediction. inspired by the work of predecessors, we proposed an improved computational model based on random forest (rf) for identifying real mirna precursor sequences (pre-mirnas). first, the occurrence frequencies of the dinucleotide of pre-mirnas genes, and the percentage of g+c content were calculated. the observed dinucleotide composition was calculated as the structural features of the sequence composition for each mirna gene. a total of cattle (bos taurus) dinucleotide compositions with their genomic g+c contents for 1064 genes encoding mirna and non-mirna sequences were calculated. in the next step two classification models based on machine learning approach were trained to identify real and pseudo bovine pre-mirnas. one set of 17 optimized features related to sequence structures were used to train the models. these models were trained and validated with 10-fold cross validation method. results: our goal was to investigate the predictive performance of rna features in distinguishing pre-mirnas from pseudo hairpins. our model achieved 99% precision, and 97.9% mcc using bos taurus datasets. conclusion: computational methods of artificial intelligence can detect novel potential mirnas in the bovine genome, some of which to have previously undetected in this genome. as a result, it seems necessary to use computational methods to identify these regulatory rnas in livestock for breeding purposes. our discoveries support that dinucleotide features will be beneficial to achieve the highest accuracies for mirna sequences prediction.
Keywords bioinformatic ,cattle (bos taurus) ,computational identification ,machine learning ,mirna
 
 

Copyright 2023
Islamic World Science Citation Center
All Rights Reserved