|
|
طبقهبندی پیشسازهای microrna در گاو (bos taurus) با استفاده از ویژگیهای کاهش یافته تکرارهای دو نوکلئوتیدی
|
|
|
|
|
نویسنده
|
سیددخت عاطفه ,رحمانینیا جواد ,کرمی حسن
|
منبع
|
پژوهشهاي توليدات دامي - 1402 - دوره : 14 - شماره : 41 - صفحه:33 -44
|
چکیده
|
مقدمه و هدف: توسعه مداوم فناوریهای مولکولی مورد استفاده برای تجزیه و تحلیل رونوشتها، بهویژه فناوریهای توالییابی نسل بعدی و ابزارهای پیشرفته بیوانفورماتیک، امکان کاوش عمیقتر rnaهای پیامرسان (mrnas) و rnaهای غیرکد کننده (ncrna) از جمله mirnaها را فراهم میکند. این فناوریها فرصتهای بزرگی را برای اکتشاف عمیقتر دخالت mirnaها در بیماریهای حیوانات مزرعه و همچنین بهرهوری و رفاه دام ارائه نمودند. از زمان کشف lin-4 و let‑7، هزاران mirna در گونههای حیوانات مزرعه شناسایی و در پایگاههای داده mirna ثبت شدهاند. mirnaها را میتوان بهعنوان نشانگرهای زیستی، اهداف تشخیصی، پیشآگهی و درمانی برای مدیریت بیماریهای دام استفاده کرد. با تعیین توالی ژنوم گاو (bos taurus)، فرصتی برای کشف mirnaهای جدید در این گونه فراهم خواهد شد. از آنجاییکه تعیین توالی و ساختار mirna ها بهصورت آزمایشگاهی هزینهبر و زمانبر است، بنابراین این پژوهش با هدف استفاده از روشهای محاسباتی مبتنی بر یادگیری ماشین بهمنظور پیشبینی micrornaها در ژنوم گاو انجام شد.مواد و روشها: یافتن روشی دقیق برای شناسایی مولکولهای mirna میتواند به درک فرآیندهای تنظیمی کمک کند. در حال حاضر روشهای محاسباتی مبتنی بر الگوریتمهای یادگیری بهطور گسترده برای پیشبینی mirnaها استفاده می شوند. با الهام از سایر تحقیقات انجام شده در زمینه شناسایی mirnaها، یک مدل محاسباتی بهبود یافته یادگیری ماشین برای شناسایی توالیهای پیشساز mirnaهای واقعی (pre-mirna) پیشنهاد شد. در مرحله اول فراوانی توالیهای دو نوکلئوتیدی ژنهای pre-mirna و محتوای بازهای سیتوزین و گوانین (g+c) در توالی ها در نظر گرفته شد. ترکیب دی نوکلئوتیدی مشاهده شده بهعنوان ویژگی های ساختاری ترکیب توالی برای هر ژن mirna محاسبه شد. مجموع ترکیبات دو نوکلئوتیدی در گونه گاو (bos taurus) با محتویات ژنومی g+c برای 1064 توالی mirna و توالی های غیر mirna محاسبه شد. در مرحله بعد دو مدل طبقهبندی مبتنی بر رویکرد یادگیری ماشین برای شناسایی pre-mirna های واقعی و شبه واقعی آموزش داده شدند. مجموعه ای از 17 ویژگی بهینه شده مربوط به ساختارهای توالی برای آموزش مدلها استفاده شد. این مدلها با روش اعتبارسنجی متقاطع 10 تایی آموزش یافتند و اعتبارسنجی شدند.یافته ها: هدف بررسی عملکرد پیشبینی طبقهبندی کنندهها براساس ویژگیهای rna در تشخیص pre-mirnaها از سایر توالیها بود. مدل آنالیز شده در این پژوهش با استفاده از مجموعه دادههای گاو (bos taurus) بهدقت 99 درصد و ضریب همبستگی متیو 97/9 درصد دست یافت.نتیجهگیری: روشهای محاسباتی هوش مصنوعی میتوانند mirnaهای بالقوه جدیدی را در ژنوم گاو شناسایی کنند که برخی از آنها قبلاً در این ژنوم شناسایی نشده بودند. در نتیجه لزوم استفاده از روشهای محاسباتی جهت شناسایی این rnaهای تنظیمی در دامها جهت اهداف اصلاحی ضروری بهمنظر میرسد. نتایج این پروژه نشان داد که تنها با استفاده از ویژگیهای ساختاری دو نوکلئوتیدی میتوان در پیشبینی توالیهای mirna بهدقت بالایی دست یافت.
|
کلیدواژه
|
بیوانفورماتیک، شناسایی محاسباتی، گاو (bos taurus)، یادگیری ماشینی، mirna
|
آدرس
|
سازمان تحقیقات، آموزش و ترویج کشاورزی, مرکز تحقیقات و آموزش کشاورزی و منابع طبیعی استان خراسان رضوی, بخش تحقیقات علوم دامی, ایران, سازمان تحقیقات، آموزش و ترویج کشاورزی, موسسه تحقیقات علوم دامی کشور, ایران, سازمان تحقیقات، آموزش و ترویج کشاورزی, موسسه تحقیقات علوم دامی کشور, ایران
|
پست الکترونیکی
|
hkarami7515@gmail.com
|
|
|
|
|
|
|
|
|
classification of microrna precursors using reduced features of dinucleotide repeats in cattle (bos taurus)
|
|
|
Authors
|
seyeddokht atefeh ,rahmaninia javad ,karami hasan
|
Abstract
|
introduction and objective: the latest major advances in transcriptomics technologies, especially next-generation sequencing technologies and advanced bioinformatics tools, allows deeper exploration of messenger rnas (mrnas) and non-coding rnas (ncrnas), including mirnas. these technologies have offered important chance for a deeper study of mirna association in farm animal diseases, as well as livestock productivity and welfare. since the discovery of lin‑4 and let‑7, many micrornas have been identified in farm animal species and deposited in mirna databases. mirna can be used as biomarkers in the context of farm animal disease diagnostics, prediction, and therapeutic purposes, for the management of livestock diseases. by the sequencing of bos taurus (cattle) genome, we have an opportunity to discover novel mirnas in this species. however, the experimental determination of mirna sequence and structure is both expensive and time-consuming, therefore, computational and machine learning-based approaches have been adopted to predict novel micrornas in the bos taurus (cattle) genome.material and methods: finding an accurate method for identification of mirna molecules can help for understanding of regulatory processes. currently, computational methods based on learning algorithms have been extensively applied for mirna prediction. inspired by the work of predecessors, we proposed an improved computational model based on random forest (rf) for identifying real mirna precursor sequences (pre-mirnas). first, the occurrence frequencies of the dinucleotide of pre-mirnas genes, and the percentage of g+c content were calculated. the observed dinucleotide composition was calculated as the structural features of the sequence composition for each mirna gene. a total of cattle (bos taurus) dinucleotide compositions with their genomic g+c contents for 1064 genes encoding mirna and non-mirna sequences were calculated. in the next step two classification models based on machine learning approach were trained to identify real and pseudo bovine pre-mirnas. one set of 17 optimized features related to sequence structures were used to train the models. these models were trained and validated with 10-fold cross validation method. results: our goal was to investigate the predictive performance of rna features in distinguishing pre-mirnas from pseudo hairpins. our model achieved 99% precision, and 97.9% mcc using bos taurus datasets. conclusion: computational methods of artificial intelligence can detect novel potential mirnas in the bovine genome, some of which to have previously undetected in this genome. as a result, it seems necessary to use computational methods to identify these regulatory rnas in livestock for breeding purposes. our discoveries support that dinucleotide features will be beneficial to achieve the highest accuracies for mirna sequences prediction.
|
Keywords
|
bioinformatic ,cattle (bos taurus) ,computational identification ,machine learning ,mirna
|
|
|
|
|
|
|
|
|
|
|