|
|
تخمین هاپلوتایپ با استفاده از فاکتورسازی ماتریس رتبهپایین در حضور دادههای پرت
|
|
|
|
|
نویسنده
|
تربالی تینا ,مجیدیان سینا ,کهایی محمد حسین
|
منبع
|
مهندسي برق و الكترونيك ايران - 1400 - دوره : 18 - شماره : 3 - صفحه:113 -120
|
چکیده
|
تخمین هاپلوتایپ بر اساس اطلاعاتdna برای کشف بیماری های ژنتیکی انسان استفاده می شود. این مسئله در پردازش ژنومی سیگنال ها به صورت یک ماتریس رتبه پایین قابل مدل سازی است که به علت محدودیت های موجود در خوانش هاپلوتایپ، فقط تعداد کمی از درایه ها مشاهده می شوند. در نتیجه یک روش موثر برای بازیابی هاپلوتایپ از مشاهدات ناقص، استفاده از روش های تکمیل ماتریس است. در این مقاله به کمک روش های تکمیل ماتریس، سعی در تخمین هاپلوتایپ از طریق فاکتورسازی ماتریسی شده است. در مراجع از روش گرادیان کاهشی برای حل مسئله استفاده شده است. اما در روش های قبلی داده های پرت نیز در محاسبات وارد می شود که باعث خطا در تخمین هاپلوتایپ شده است. به عبارتی در این روش ها به شروط موجود برای ماتریس های هاپلوتایپ توجه نشده است و این موضوع باعث تخمین داده های پرت برای هاپلوتایپ شده است. در این مقاله با روش تکمیل ماتریس و با در نظر گرفتن این شروط در ماتریس هاپلوتایپ، یک تابع هزینه جدید به صورت عبارت جریمه برای تخمین هاپلوتایپ معرفی می کنیم. عبارت جدید اضافه شده به تابع هزینه باعث می شود که اثر داده های پرت کاهش یافته و در نتیجه دقت تخمین هاپلوتایپ افزایش می یابد. نتایج شبیه سازی نیاز کاهش خطای بازیابی هاپلوتایپ را تایید می کند.
|
کلیدواژه
|
تخمین هاپلوتایپ، ماتریس رتبه پایین، تکمیل ماتریس.
|
آدرس
|
دانشگاه علم و صنعت ایران, دانشکده مهندسی برق, ایران, دانشگاه علم و صنعت ایران, دانشکده مهندسی برق, ایران, دانشگاه علم و صنعت ایران, دانشکده مهندسی برق, ایران
|
پست الکترونیکی
|
kahaei@iust.ac.ir
|
|
|
|
|
|
|
|
|
Haplotype Estimation Using Low-Rank Matrix Factorization in Presence of Outliers
|
|
|
Authors
|
Tarbali Tina ,Majidians sina ,Kahaei Mohammed Hussain
|
Abstract
|
Haplotype estimates based on DNA information are used to detect human genetic diseases. This problem can be modeled in the genomic processing of signals as a lowrank matrix in which only a few elements are observed. As a result, an effective way to estimate the haplotype from incomplete observations is to use matrix completion methods. In this paper, using matrix completion methods, an attempt has been made to estimate the haplotype through matrix factorization. In references, the reduction gradient method has been used to solve the problem. However, in the previous methods, outliers were also included in the calculations, which caused an error in the haplotype estimation. In other words, these methods do not pay attention to the existing conditions for haplotype matrices, and this has led to outdated estimates for haplotypes. In this paper, with the matrix completion method and considering these conditions in the haplotype matrix, we introduce a new cost function as a penalty expression for haplotype estimation. The new expression added to the cost function reduces the effect of skewed data and thus increases the accuracy of haplotype estimates. The simulation results confirm the need to reduce the haplotype retrieval error
|
Keywords
|
Haplotype estimation ,low rank matrix ,matrix completion.
|
|
|
|
|
|
|
|
|
|
|