|
|
پویش ژنومی برپایه آنالیز مسیر مرتبط با صفت بال فرشته ای در اردک های نژاد پیکین با استفاده از داده های توالی یابی کل ژنوم
|
|
|
|
|
نویسنده
|
محمدی حسین
|
منبع
|
پژوهشهاي علوم دامي ايران - 1403 - دوره : 15 - شماره : 2 - صفحه:32 -43
|
چکیده
|
مقدمه و هدف: بال فرشته یک بدشکلی توسعه یافته بال است که می تواند بر پرورش و تولیدمثل در گله های تجاری اردک تاثیر گذار باشد. از این رو مطالعه تنوع ژنتیکی و شناسایی مناطق ژنومی موثر بر صفت بال فرشته ای در جمعیت های اردک، امری ضروری در این گونه محسوب می شود. در این راستا، ابزارهای قدرتمندی مانند نسل جدید توالی یابی امکان رمزگشایی اطلاعات کل ژنوم در این گونه را فراهم آورده است. به طور معمول در مطالعات پویش کل ژنومی در نظر گرفتن تصحیحات سختگیرانه برای جلوگیری از نتایج مثبت کاذب ضروری می باشد، ولی اعمال این نوع تصحیحات موجب از دست رفتن نشانگرهای snp با اثر کوچکتر موثر بر صفات کمّی می گردد که نتیجه آن شناسایی snpهایی می گردد که تنها بخش کوچکی از تنوع ژنتیکی صفت را نشان می دهد و از این رو در اکثر مواقع بخش عمده واریانس ژنتیکی پنهان باقی می ماند. یکی از روش های جایگزین استفاده از آنالیزهای غنی سازی مجموعه های ژنی می باشد. در این روش ارتباط بین صفت مورد مطالعه و نشانگرهای ژنتیکی را در یک دسته یا گروه ژنی که به طور عملکردی با هم مرتبط هستند بررسی می کند. در حقیقت در این روش به دنبال ژن هایی هستیم که به تنهایی اثر آنها بر صفت مورد نظر معنی دار نشده، ولی اثر تجمعی آنها روی صفت دارای اثر معنی دار است. علاوه براین، یکی از دلایل اصلی آنالیز غنی سازی مجموعه های ژنی تعداد کم بودن snpهای معنی دار می باشد که موجب عدم شناسایی مناطق ژنومی مرتبط با صفات مهم اقتصادی می گردد. در نتیجه روش پویش ژنومی بر مبنای مسیر کارآیی بهتری برای یافتن مناطق ژنومی، درک بهتر مکانیسم و معماری ژنتیکی را دارا می باشد. بنابراین، هدف از پژوهش حاضر شناسایی مناظق ژنومی و ژن های کاندیدای مرتبط با صفت بال فرشته ای در اردک با استفاده از پویش کل ژنوم بر پایه آنالیز مسیر می باشد. مواد و روش ها: بدین منظور از اطلاعات داده ژنوم توالی یابی شده 63 قطعه اردک شامل 30 قطعه دارای بال نرمال (شاهد) و 33 قطعه دارای بال فرشته ای (موردی) استفاده شد. توالی یابی کل ژنوم توسط شرکت ایلومینا hiseq 4000 انجام شده بود. ابتدا نشانگرهای snp شناسایی شده از ایندل جدا شدند و با استفاده از برنامه gatk فیلتر شدند. سپس با استفاده از برنامه plink، snpهای دو آللی با حداقل فراوانی آللی بزرگتر یا مساوی با 0/01 که حداقل در 95 درصد افراد دارای ژنوتیپ مشخص بودند، حفظ شده و مابقی حذف شدند. که در نهایت 14064984 نشانگر snp بعد از مراحل مختلف کنترل کیفیت باقی ماندند. در گام بعدی برای شناسایی snpهای مستقل از نرم افزارplink استفاده شد. برای این منظور با حذف snpهایی که در حالت عدم تعادل پیوستگی بالایی با یکدیگر قرار داشتند، در پنجره هایی شامل snp 50 و با حرکت snp 5 رو به جلو در هر مرحله، snpهای دارای r2 (معیار عدم تعادل پیوستگی) بیش از 0/2 (دستور --indep-pairwise 50 5 0.2) با یکدیگر از مجموعه داده ها حذف شدند. در نهایت بعد از کنترل کیفیت تعداد 686449 snp برای آنالیزهای پویش کل ژنومی بر پایه تجزیه و تحلیل غنی سازی مجموعه ژنی باقی ماندند. اساساً آنالیز پویش ژنومی بر پایه تجزیه و تحلیل مجموعه های ژنی در سه مرحله انجام می گردد: 1) تعیین مکان snpهای معنی دار با ژن 2) ارتباط ژن ها به طبقات عملکردی و مسیرهای زیستی 3) پویش کل ژنومی بر پایه آنالیز مسیر. 1- تعیین مکان snpها با ژن ها: snpهایی که مقدار p-value آنها کمتر از 0/005 بود با استفاده از بسته نرم افزاری biomart2 در محیط r و با استفاده از رفرانس ژنومی اردک (cau_duck1.0) به ژن هایی که نشانگر snp موردنظر در داخل آن ژن و یا kb 15 بالادست یا پایین دست آن ژن قرار داشت، ارتباط داده شدند. 2- ارتباط ژن ها به طبقات عملکردی و مسیرهای بیوشیمیایی: جهت تعیین طبقات عملکردی ژنی و مسیرهای متابولیکی و تنظیمی ژن های معنی دار از 5 پایگاه های اطلاعاتی شامل هستی شناسی ژن (http://www.geneontology.org/go, )، مسیرهای بیوشیمیایی (http://www.genome.jp/kegg/kegg, )، panther (http://www.pantherdb.org)، metacyc (http://www.metacyc.org) و reactome (http://www.reactome.org) جهت تعیین طبقات عملکردی و مسیرهای بیوشیمیایی استفاده گردید. 3- پویش کل ژنومی بر پایه آنالیز مسیر: ارتباط های معنی دار مسیرهای عملکردی با صفت با فرشته ای با استفاده از توزیع فوق هندسی و آماره fisher’s exact test مورد آزمون قرار گرفت.یافته ها: نتایج آنالیز pca نشان داد که با pc1 گروه جمعیت سالم و pc2 گروه جمعیت بیمار را به خوبی از یکدیگر تفکیک و جدا کردند. در این پژوهش نشانگرهای تک نوکلئوتیدی واقع روی کروموزومهای 1، 2، 3، 6، 8، 11، 18، 20، 27 و 31 شناسایی شدند که با ژنهای atp11a، ube2e2، itpr2، guca1c،atp2c1، plcg1 و bmpr1a مرتبط بودند. در تفسیر مجموعه ژنی، تعداد 21 مسیر هستی شناسی ژنی و بیوشیمیایی با صفت بال فرشته ای شناسایی شد (0/05>p). از این بین، مسیرهای skeletal muscle myosin thick filament assembly، response to calcium ion،wing disc morphogenesis و calcium signaling pathway عملکردهای مهمی را در ارتباط با رشد و توسعه ی عضلات اسکلتی، پاسخ به یون کلسیم، رشد و توسعه استخوان، حجم مواد معدنی استخوان و فعال سازی مسیر سیگنال دهی کلسیم بر عهده داشتند.نتیجه گیری: با توجه به نقش کلیدی و موثر ژن های کاندیدای شناسایی شده بر صفت بال فرشته ای در این تحقیق، در صورت تایید به وسیله مطالعات تکمیلی می توان از آنها در انتخاب ژنتیکی گله های تجاری اردک مورد استفاده قرار گیرند.
|
کلیدواژه
|
آنالیز غنی سازی، اردک، بدشکلی بال، توالی یابی نسل بعد، داده های ژنومی
|
آدرس
|
دانشگاه اراک, دانشکده کشاورزی و محیط زیست, گروه علوم دامی, ایران
|
پست الکترونیکی
|
h-mohammadi64@araku.ac.ir
|
|
|
|
|
|
|
|
|
a genome-wide association study based on pathway analysis related to the angle wing in pekin ducks using whole-genome sequencing data
|
|
|
Authors
|
mohammadi hoossein
|
Abstract
|
extended abstractbackground: angel wing is a developmental wing deformity that can influence breeding and reproduction in the commercial duck industry. therefore, genetic diversity studies and detection of the genomic region related to angel wings in duck populations are essential. in this regard, powerful tools, such as next-generation sequencing technology, have made it possible to decode genome information in this species. the genome-wide association study (gwas) has been a powerful tool in detecting loci associated with complex traits and diseases; however, it also has some limitations. complex traits are controlled by many genes, and hence, significant snps in general represent only a small fraction of genetic variation. moreover, studies often report only the most significant snps and their neighboring genes, hence some smaller genetic variants and disease risks are unlikely to be detected. alternatively, pathway-based analysis has been proposed as a complementary approach to investigate complex traits from a genetic and biological perspective. in contrast to a gwas, pathway-based analysis considers factors that contribute simultaneously to the complex trait and looks beyond the most significant snps and genes. to complement gwas studies, it is becoming common to use gene-set enrichment and pathway analyses. such an approach helps alleviate problems related to gwas (e.g., gwas ignores the fact that genes work together in networks in various biological pathways), and to deepen the understanding of the biological pathways affecting quantitative traits. integration of f, gwas, and pathways analyses might address some aforementioned issues and has been already used in human studies, whereas its potential application in livestock breeding and genetics remains still unexplored. in addition, studies are available that performed gwas or gwas plus pathway analysis.methods: a total of 63 adult purebred pekin ducks from the same population were selected for this study, of which 33 were ducks that could be identified as having angel wings (case) and 30 were ducks with normal wings (control). genomic dna was extracted from blood samples by dna extraction using a kit (qiaampr dna blood mini kit; qiagen), following the manufacturer’s protocol. whole-genome re-sequencing data were generated on the illumina hiseq 4000 platform with 150 bp paired-end reads. single-nucleotide polymorphism (snp) calling was performed using the gatk (v4.1), and all parameters were kept at default settings, except for stand_callconf 30. vcftools (v0.1.16) and plink (v 1.90) were used for the quality control of the data. the 14 064 984 snps passed quality control that excluded snps using the following criteria: --min- alleles 2, --max- alleles 2, --mindp 3 –minq 30 with vcftools, minor allele frequency >0.01, and snp call rate ≥ 0.95 with plink. an independent snp set was used via the plink command --indep- pairwise 50 5 0.2 for principal component analysis. after quality control, 686 449 snps were used for the gwas. the gene set analysis consists basically of three different steps: (i) the assignment of snps to genes, (ii) the assignment of genes to functional categories, and (iii) an association analysis between each functional category and the phenotype of interest. 1. the snps were assigned to bovine genes based on the cau_duck1.0 duck genome sequence assembly using the bioconductor r package biomart2. a given snp was assigned to a particular gene if it was located within the gene or at most 15 kb either upstream or downstream of the gene. an arbitrary threshold of p-value ≤ 0.005 was used to define significant snps (based on the results of the gwas); in this context, significant genes were defined as those genes that contained at least one significant snp. 2. the databases gene ontology (go) and medical subject headings (mesh) were used to define functional categories of genes. the idea is that genes assigned to the same functional category can be considered the members of a group of genes that share some particular properties, typically their involvement in the same biological or molecular process. 3. the significant association of a given term with angle wing was analyzed using fisher’s exact test. finally, a gene enrichment analysis was performed with the gostats bioconductor from r software for the assignment of the genes to functional categories.results: the random effect was estimated from the groups clustered based on the kinship among all accessions, and the first two pcs, including pc1 with normal wings and pc2 with angel wings derived from whole-genome snps, were used as fixed effects in the mixed model to correct for stratification. in this research, snp markers were identified on chromosomes 1, 2, 3, 6, 8, 11, 18, 20, 27, and 31. different sets of candidate genes related to the angle wing trait, namely atp11a, ube2e2, itpr2, guca1c, atp2c1, plcg1, and bmpr1a, were also identified in ducks. some of the found genes are consistent with some of the previous studies related to wing traits. according to pathway analysis, 21 pathways from go and biological pathways were associated with the angle wing trait. some of the detected genes are consistent with some previous studies and are involved in biological pathways related to skeletal muscle growth and development, calcium ion response, bone growth and development, bone minerals, and calcium signaling pathway activation.conclusion: the results of our research can be used to understand the genetic mechanism controlling the angle wing trait. this study supports previous results from the gwas of reproductive traits, revealing additional regions. using these findings could potentially be useful for genetic selection in ducks.
|
Keywords
|
duck ,enrichment analysis ,genomic data ,next generation sequencing ,wing deformity
|
|
|
|
|
|
|
|
|
|
|