|
|
ترکیب یک روش خوشهبندی تجمعی و یک معیار شباهت جدید برای مدلسازی رفتار وراثتی بیماریها
|
|
|
|
|
نویسنده
|
مجرد موسی ,پروین حمید ,نجاتیان صمد ,باقری فرد کرم الله
|
منبع
|
پردازش علائم و داده ها - 1400 - شماره : 2 - صفحه:97 -114
|
چکیده
|
امروزه تئوریهای بسیاری در مورد علل بروز بیماریهای وراثتی وجود دارد، اما پزشکان معتقدند که دو فاکتور ژنتیک و محیطزیست همزمان باهم نقش مهمی در بروز و پیشرفت این بیماریها ایفا میکنند، هرچند که چگونگی این اثرگذاری هنوز بهطور دقیق مشخص نیست. برای اینکه بتوان ژنهای موثر در بروز بیماریها را تشخیص داد، باید ارتباط بین سلولها/بافت ها را به دست آورد. تعامل بین سلولهای/بافتهای مختلف را میتواند با بیان ژن بین آنها مختلف نشان داد. با نمونه برداری از کروموزومها، اطلاعات مفیدی در مورد نوع بیماری و چگونگی انتقال آن استخراج می شود. با بررسی این اطلاعات می توان اختلالاتی که منجر به تغییرات بهشدت پرتکراری شده اند را شناسایی کرد. در این مقاله تشخیص ارتباطهای بین سلولی و بین بافتی در بیماریهای مختلف با توجه به مشخصات ساختار توپولوژیکی گراف و یک روش خوشهبندی تجمعی بهبودیافته انجام شده است. روش پیشنهای دارای دو مرحله میباشد؛ در مرحله اول چندین مدل خوشهبندی بهمنظور تشخیص ارتباطهای اولیه بین سلولها یا بافتها در جهت تولید نتایج بهتر نسبت به الگوریتمهای انفرادی، ترکیب میشوند. در مرحله دوم تشابه بین سلولها یا بافتها در هر خوشه با استفاده از یک معیار شباهت مبتنی بر ساختار توپولوژیکی گراف محاسبه میشود. درنهایت از حداکثر شباهت های بین سلول ها یا بافت ها در هر خوشه برای کشف ارتباطات بین بیماری ها استفاده می شود. بهمنظور ارزیابی عملکرد روش پیشنهادی از چندین مجموعه داده uci و همچنین مجموعه داده فانتوم 5 استفاده شده است. نتایج روش پیشنهادی روی مجموعه داده فانتوم 5، ضریب سیلوئت 0.901 را در 18 خوشه برای سلول ها و 0.762 در 13 خوشه برای بافت ها را گزارش می کند.
|
کلیدواژه
|
ارتباط بین سلولی، خوشهبندی بهبودیافته، ساختار توپولوژیکی گراف، مجموعه داده فانتوم 5.
|
آدرس
|
دانشگاه آزاد اسلامی واحد فیروزآباد, گروه کامپیوتر, ایران, دانشگاه آزاد اسلامی واحد نورآباد ممسنی, گروه کامپیوتر, ایران, دانشگاه آزاد اسلامی واحد یاسوج, گروه برق, ایران, دانشگاه آزاد اسلامی واحد یاسوج, باشگاه پژوهشگران جوان, گروه کامپیوتر, ایران
|
پست الکترونیکی
|
k.bagheri@iauyasooj.ac.ir
|
|
|
|
|
|
|
|
|
Combining a Ensemble Clustering Method and a New Similarity Criterion for Modeling the Hereditary Behavior of Diseases
|
|
|
Authors
|
mojarad musa ,parvin hamid ,nejatiyan samad ,Bagheri Fard Karam allah
|
Abstract
|
There are many theories about the causes of hereditary diseases, but physician believe that both the genetic and environmental factors simultaneously play an important role in the development and progression of these diseases, although the extent to which this effect is not yet clear. In order to detect effective genes in the development of diseases, it is necessary to achieve the relationship between cells/tissues. The interaction between different cells/tissues can be demonstrated by expressing the gene between them. By sampling chromosomes, useful information is obtained about the type of disease and how it is transmitted. By examining this information, you can identify disorders that have led to highly altered changes. In this paper, the recognition of intercellular and intertissue interactions in various diseases has been done according to the characteristics of the topological structure of the graph and an improved cumulative clustering method. The proposed method has two stages; in the first step, several clustering models are combined to identify the initial relationships between cells or tissues in order to produce better results than individual algorithms. In the second stage, the similarity between cells or tissues in each cluster is calculated using a similarity criterion based on the topological structure of the graph. Eventually, the maximum similarity between cells or tissues in each cluster is used to discover the relationship between diseases. To evaluate the performance of the proposed method, several UCI datasets and the Phantom 5 dataset have been used. The results of the proposed method on the phantom data set 5 report a silhouette of 0.901 in 18 clusters for cells and 0.762 in 13 clusters for tissues.
|
Keywords
|
Intercellular communication ,Improved clustering ,Graph topological structure ,Phantom 5 data set.
|
|
|
|
|
|
|
|
|
|
|