>
Fa   |   Ar   |   En
   مقایسه برخی نرم‌افزارهای مکانیابی در آنالیز داده‌های Rna-Seq گاو شیری  
   
نویسنده الیاسی زرین قبایی قربان ,صادقی مصطفی ,میرایی آشتیانی رضا
منبع پژوهشهاي توليدات دامي - 1402 - دوره : 14 - شماره : 39 - صفحه:131 -138
چکیده    مقدمه و هدف: با توجه به کاربرد روزافزون تعیین توالی نسل جدید (ngs)، جهت شناسایی ژن‌های عملکردی،‏ استفاده از الگوریتم‌ها و نرم‌افزارهای تخصصی برای انجام آنالیزهای آماری ضروری است. مکان‌یابی خوانش‌ها با ژنوم مرجع اولین و مهم‌ترین مرحله اکثر برنامه‌های آنالیز داده‌های rna-seq است که به‌صورت موثری صحت آنالیزهای پایین دستی بستگی به این مرحله دارد. لذا هدف از این تحقیق، مقایسه برخی نرم‌افزارهای مختلف هم‌ترازی داده‌های حاصل از تعیین توالی کل rna روی ژنوم مرجع بود.مواد و روش‌ها: از داده‌های rna-seq مربوط به 54 راس گاو شیری هلشتاین به‌منظور شناسایی ژن‌های موثر در باروری استفاده شد. تعیین کیفیت خوانش‌ها‏ توسط نرم‌افزار fastqc و ویرایش توالی‌های کم کیفیت با استفاده از نرم‌افزار trimmomatic انجام شد. داده‌های ویرایش شده با آخرین نسخه ژنوم مرجع گاو با استفاده از نرم‌افزارهای bowtie2،‌ ‏tophat2 و hisat2 مکان‌یابی شدند. درصد کل خوانش‌های مکان‌یابی شده، درصد خوانش‌های مکان‌یابی شده روی یک محل در ژنوم مرجع و همچنین درصد خوانش‌های مکان‌یابی شده روی بیش از یک محل محاسبه شدند.یافته‌ها: نتایج نشان داد که بیشترین هم‌ترازی صورت گرفته روی ژنوم مرجع گاو با استفاده از نرم‌افزار ‏‏tophat2 بوده است. از کل خوانش‌های موجود، نرم افزارهای tophat2 و hisat2 به ترتیب 94/197 و 92/526 درصد را روی ژنوم مرجع مکان‌یابی نمودند. نرم‌افزار hisat2 عملکرد تخصیصی بیشتری داشت و 89/202 درصد از داده‌ها را به یک جایگاه اختصاصی مکان‌یابی کرد درصورتی‌که این پارامتر در خصوص نرم‌افزار tophat2 به میزان 87/812 درصد از کل توالی‌ها بود. از کل توالی‌های به کار گرفته شده تنها 3/324 درصد توسط hisat2 و 6/385 درصد توسط tophat2 با بیش از یک جایگاه ژنوم مرجع مکان‌یابی شدند. نرم‌افزار bowtie2‌ در مقایسه با دو نرم‌افزار دیگر عملکرد پایینی داشت.نتیجه‌گیری: مقایسه نرم‌افزارهای هم‌ترازی داده‌های rna-seq روی ژنوم مرجع نشان داد که اگر چه نرم‌افزار hisat2 بهترین نرم‌افزار برای مکان‌یابی خوانش‌ها بود بود ولی نرم افزار tophat2 هم می‌تواند به جای آن در آنالیز داده های rna-seq استفاده شود. در ضمن نرم‌افزار bowtie2 در ارتباط با داده‌های rna-seq کارآیی چندانی ندارد.
کلیدواژه اومیکس‌، بیان ژن، تعیین توالی، ژنوم مرجع و مکان‌یابی
آدرس دانشگاه تهران، پردیس کشاورزی و منابع طبیعی, گروه علوم دامی, ایران, دانشگاه تهران، پردیس کشاورزی و منابع طبیعی, گروه علوم دامی, ایران, دانشگاه تهران، پردیس کشاورزی و منابع طبیعی, گروه علوم دامی, ایران
 
   comparison of some alignment software in the analysis of dairy cows rna-seq data  
   
Authors elyasi zarringhabaie ghorban ,sadeghi mostafa ,miraie ashtiani reza
Abstract    extended abstractintroduction and objective: due to the increasing use of next generation sequencing (ngs), it is necessary to use specialized algorithms and software to perform statistical analysis in order to identify functional genes. alignment of reads with the reference genome is the first and most important step in most rna-seq data analysis programs, and the accuracy of downstream analyzes effectively depends on this step. therefore, the aim of this research was to compare some different software for aligning the data obtained from total rna sequencing on the reference genome.material and methods: rna-seq data related to 54 holstein dairy cows raised in industrial conditions were used to identify genes effective in fertility. the quality of the reads was determined by fastqc software and editing of low quality sequences was done using trimmomatic software. the edited data were aligned with bovine reference genome using bowtie2, tophat2 and hisat2 softwares. the total percentage of mapped reads, the percentage of mapped reads on one location in the reference genome, and the percentage of mapped reads on more than one location were calculated.results: the results showed that the most alignment was done on the cow reference genome using tophat2 software. which mapped 94.197% of the from the total available reads, 94.197% and 92.526% were mapped on the reference genome by tophat2 and hisat2 software, respectively.  the hisat2 software had more allocation function and mapped 89.202% of the data to a specific position, while this parameter was 87.812% of the total sequences  for tophat2 software. from the total used sequences, only 3.324% and 6.385% of the sequences were aligned by hisat2 and tophat2 software respectively to more than one position of the reference genome. bowtie2 software had low performance compared to  other two software.conclusion: the comparison of rna-seq data alignment software on the reference genome showed that although the hisat2 swas the best read mapping software  but, tophat2 software can also be used instead in rna-seq data analysis. meanwhile, bowtie2 software is not very effective in relation to rna-seq data.
Keywords gene expression ,mapping ,omix ,reference genome and sequencing
 
 

Copyright 2023
Islamic World Science Citation Center
All Rights Reserved