|
|
مقایسه برخی نرمافزارهای مکانیابی در آنالیز دادههای rna-seq گاو شیری
|
|
|
|
|
نویسنده
|
الیاسی زرین قبایی قربان ,صادقی مصطفی ,میرایی آشتیانی رضا
|
منبع
|
پژوهشهاي توليدات دامي - 1402 - دوره : 14 - شماره : 39 - صفحه:131 -138
|
چکیده
|
مقدمه و هدف: با توجه به کاربرد روزافزون تعیین توالی نسل جدید (ngs)، جهت شناسایی ژنهای عملکردی، استفاده از الگوریتمها و نرمافزارهای تخصصی برای انجام آنالیزهای آماری ضروری است. مکانیابی خوانشها با ژنوم مرجع اولین و مهمترین مرحله اکثر برنامههای آنالیز دادههای rna-seq است که بهصورت موثری صحت آنالیزهای پایین دستی بستگی به این مرحله دارد. لذا هدف از این تحقیق، مقایسه برخی نرمافزارهای مختلف همترازی دادههای حاصل از تعیین توالی کل rna روی ژنوم مرجع بود.مواد و روشها: از دادههای rna-seq مربوط به 54 راس گاو شیری هلشتاین بهمنظور شناسایی ژنهای موثر در باروری استفاده شد. تعیین کیفیت خوانشها توسط نرمافزار fastqc و ویرایش توالیهای کم کیفیت با استفاده از نرمافزار trimmomatic انجام شد. دادههای ویرایش شده با آخرین نسخه ژنوم مرجع گاو با استفاده از نرمافزارهای bowtie2، tophat2 و hisat2 مکانیابی شدند. درصد کل خوانشهای مکانیابی شده، درصد خوانشهای مکانیابی شده روی یک محل در ژنوم مرجع و همچنین درصد خوانشهای مکانیابی شده روی بیش از یک محل محاسبه شدند.یافتهها: نتایج نشان داد که بیشترین همترازی صورت گرفته روی ژنوم مرجع گاو با استفاده از نرمافزار tophat2 بوده است. از کل خوانشهای موجود، نرم افزارهای tophat2 و hisat2 به ترتیب 94/197 و 92/526 درصد را روی ژنوم مرجع مکانیابی نمودند. نرمافزار hisat2 عملکرد تخصیصی بیشتری داشت و 89/202 درصد از دادهها را به یک جایگاه اختصاصی مکانیابی کرد درصورتیکه این پارامتر در خصوص نرمافزار tophat2 به میزان 87/812 درصد از کل توالیها بود. از کل توالیهای به کار گرفته شده تنها 3/324 درصد توسط hisat2 و 6/385 درصد توسط tophat2 با بیش از یک جایگاه ژنوم مرجع مکانیابی شدند. نرمافزار bowtie2 در مقایسه با دو نرمافزار دیگر عملکرد پایینی داشت.نتیجهگیری: مقایسه نرمافزارهای همترازی دادههای rna-seq روی ژنوم مرجع نشان داد که اگر چه نرمافزار hisat2 بهترین نرمافزار برای مکانیابی خوانشها بود بود ولی نرم افزار tophat2 هم میتواند به جای آن در آنالیز داده های rna-seq استفاده شود. در ضمن نرمافزار bowtie2 در ارتباط با دادههای rna-seq کارآیی چندانی ندارد.
|
کلیدواژه
|
اومیکس، بیان ژن، تعیین توالی، ژنوم مرجع و مکانیابی
|
آدرس
|
دانشگاه تهران، پردیس کشاورزی و منابع طبیعی, گروه علوم دامی, ایران, دانشگاه تهران، پردیس کشاورزی و منابع طبیعی, گروه علوم دامی, ایران, دانشگاه تهران، پردیس کشاورزی و منابع طبیعی, گروه علوم دامی, ایران
|
|
|
|
|
|
|
|
|
|
|
comparison of some alignment software in the analysis of dairy cows rna-seq data
|
|
|
Authors
|
elyasi zarringhabaie ghorban ,sadeghi mostafa ,miraie ashtiani reza
|
Abstract
|
extended abstractintroduction and objective: due to the increasing use of next generation sequencing (ngs), it is necessary to use specialized algorithms and software to perform statistical analysis in order to identify functional genes. alignment of reads with the reference genome is the first and most important step in most rna-seq data analysis programs, and the accuracy of downstream analyzes effectively depends on this step. therefore, the aim of this research was to compare some different software for aligning the data obtained from total rna sequencing on the reference genome.material and methods: rna-seq data related to 54 holstein dairy cows raised in industrial conditions were used to identify genes effective in fertility. the quality of the reads was determined by fastqc software and editing of low quality sequences was done using trimmomatic software. the edited data were aligned with bovine reference genome using bowtie2, tophat2 and hisat2 softwares. the total percentage of mapped reads, the percentage of mapped reads on one location in the reference genome, and the percentage of mapped reads on more than one location were calculated.results: the results showed that the most alignment was done on the cow reference genome using tophat2 software. which mapped 94.197% of the from the total available reads, 94.197% and 92.526% were mapped on the reference genome by tophat2 and hisat2 software, respectively. the hisat2 software had more allocation function and mapped 89.202% of the data to a specific position, while this parameter was 87.812% of the total sequences for tophat2 software. from the total used sequences, only 3.324% and 6.385% of the sequences were aligned by hisat2 and tophat2 software respectively to more than one position of the reference genome. bowtie2 software had low performance compared to other two software.conclusion: the comparison of rna-seq data alignment software on the reference genome showed that although the hisat2 swas the best read mapping software but, tophat2 software can also be used instead in rna-seq data analysis. meanwhile, bowtie2 software is not very effective in relation to rna-seq data.
|
Keywords
|
gene expression ,mapping ,omix ,reference genome and sequencing
|
|
|
|
|
|
|
|
|
|
|