|
|
انتخاب ویژگی و طبقهبندی سلولهای سرطانی بر پایه دادههای ریزآرایه با استفاده از الگوریتم جستجوی فاخته چندهدفه
|
|
|
|
|
نویسنده
|
کمری خدیجه ,رشیدی فرزان ,خلیلی عبدالله
|
منبع
|
مهندسي برق و مهندسي كامپيوتر ايران - 1398 - دوره : 17 - شماره : 4 - صفحه:253 -266
|
چکیده
|
دادههای ریزآرایه نقش موثری در طبقهبندی و تشخیص انواع بافتهای سرطانی ایفا میکنند. با این حال در پژوهشهای مرتبط با سرطان، تعداد نسبتاً کم نمونهها در مقایسه با تعداد بسیار زیاد ژنها، باعث ایجاد مشکلاتی از قبیل کاهش کارایی طبقهبندها، افزایش هزینههای محاسباتی و پیچیدگی در طبقهبندی سلولهای سرطانی خواهد شد. یک راهکار مناسب جهت افزایش کارایی طبقهبندها، حذف ژنهای نامربوط و انتخاب نمونههای مناسب برای آموزش طبقهبندها است. در این مقاله یک مدل ترکیبی بر پایه الگوریتم بهینهسازی جستجوی فاخته چندهدفه و خوشهبندی فازی برای طبقهبندی دادههای ریزآرایه پیشنهاد شده است. در این مطالعه از نسخه دودویی الگوریتم جستجوی فاخته چندهدفه به منظور انتخاب ویژگیهای مرتبط با بیماری و از نسخه پیوسته آن برای انتخاب تعداد نمونههای مناسب برای آموزش طبقهبندها استفاده شده است. به منظور تسریع در فرایند بهینهسازی و جلوگیری از گیرافتادن الگوریتم در بهینههای محلی، راهکارهای ابتکاری جدیدی نیز به الگوریتم اضافه شدهاند. برای بررسی عملکرد مدل پیشنهادی، شبیهسازیهای متعددی بر روی شش مجموعه داده سرطانی انجام گرفته و نتایج آن با دیگر مقالات مقایسه شده است. نتایج به دست آمده نشان میدهند در بسیاری از موارد مدل پیشنهادی قادر است در مقایسه با سایر روشها، با انتخاب مجموعه کوچکتری از ژنهای متمایز، منجر به افزایش کارایی طبقهبندها شود.
|
کلیدواژه
|
انتخاب ویژگی، انتخاب نمونه، دادهکاوی، ریزآرایه، الگوریتم جستجوی فاخته چندهدفه، خوشهبندی فازی
|
آدرس
|
دانشگاه هرمزگان, دانشکده فنی و مهندسی, ایران, دانشگاه هرمزگان, دانشکده فنی و مهندسی, ایران, دانشگاه هرمزگان, دانشکده فنی و مهندسی, ایران
|
پست الکترونیکی
|
khalili@hormozgan.ac.ir
|
|
|
|
|
|
|
|
|
Feature Selection and Cancer Classification Based on Microarray Data Using MultiObjective Cuckoo Search Algorithm
|
|
|
Authors
|
Kamari kh. ,rashidi f. ,Khalili a.
|
Abstract
|
Microarray datasets have an important role in identification and classification of the cancer tissues. In cancer researches, having a few samples of microarrays in cancer researches is one of the most concerns which lead to some problems in designing the classifiers. Moreover, due to the large number of features in microarrays, feature selection and classification are even more challenging for such datasets. Not all of these numerous features contribute to the classification task, and some even impede performance. Hence, appropriate gene selection method can significantly improve the performance of cancer classification. In this paper, a modified multiobjective cuckoo search algorithm is used to feature selection and sample selection to find the best available solutions. For accelerating the optimization process and preventing local optimum trapping, new heuristic approaches are included to the original algorithm. The proposed algorithm is applied on six cancer datasets and its results are compared with other existing methods. The results show that the proposed method has higher accuracy and validity in comparison to other existing approaches and is able to select the small subset of informative genes in order to increase the classification accuracy.
|
Keywords
|
|
|
|
|
|
|
|
|
|
|
|