|
|
تشخیص نوع سرطان پستان با استفاده از انتخاب ژنهای موثر از دادههای ریزآرایه
|
|
|
|
|
نویسنده
|
طباطبایی ابوالفضل ,درهمی ولی ,شیخ پور راضیه ,پژوهان محمدرضا
|
منبع
|
بيماري هاي پستان ايران - 1398 - دوره : 12 - شماره : 1 - صفحه:39 -47
|
چکیده
|
مقدمه: تشخیص زودهنگام سرطان پستان و ژن های موثر در آن نقش بسیار کلیدی در درمان و حیات بیمار ایفا می کند. با استفاده ازداده های بیان ژن استخراج شده از فناوری ریزآرایه و الگوریتم های یادگیری ماشین می توان روش های نوین و هوشمندی درنظام سلامت و درمان ارایه داد که با دقت بالایی قادر به تشخیص سرطان پستان باشند. روش بررسی: داده های استفاده شده در این پژوهش، شامل داده های بیان9216 ژن مربوط به 84 بیمار در 5 نوع مختلف سرطان است که با استفاده از فناوری ریزآرایه به دست آمده است. در این مطالعه برای افزایش کارایی سیستم های تشخیص سرطان پستان، روش انتخاب ویژگی مبتنی بر ارتباط بین بیان غیرنرمال ژن و سرطان ارایه شده است. سپس از سه دسته بند پرکاربرد و رایج k نزدیک ترین همسایه (knn)، ماشین بردار پشتیبان (svm) و بیزی ساده (nb) برای سنجش کارایی ژن های انتخاب شده استفاده شد. یافته ها: بررسی های انجام شده نشان دادند که با روش انتخاب ویژگی پیشنهادی و با استفاده از دسته بند knn می توان فقط با انتخاب 38 ژن از میان 9216 ژن مربوط به داده های بیماران سرطانی که با استفاده از فناوری ریزآرایه به دست آمده است، انواع سرطان پستان بیماران در داده های آزمایش را با دقت 100% تشخیص داد و ژن های مرتبط با هر کلاس را نیز تفکیک کرد. همچنین با استفاده از دسته بند nb، دقت 90% با 17 ژن و با دسته بند svm، دقت 96.67% با 22 ژن انتخابی به دست آمد.نتیجه گیری: نتایج این مطالعه نشان دادند که روش انتخاب ویژگی پیشنهادی، با در نظر گرفتن همزمان دو معیار دقت و تعداد ژن انتخابی، عملکرد مناسبی نسبت به سایر روش ها دارد. توانایی تفکیک ژن های موثر در هر کلاس سرطان، به علاوه تشخیص بیان بیشتر از حد یا کمتر از حد ژن های انتخابی، از خصوصیات ویژه روش پیشنهادی است که می تواند مورد استفاده متخصصین و پژوهشگران حوزه درمان و مراقبت قرار گیرد.
|
کلیدواژه
|
سرطان پستان، انتخاب ویژگی، دادههای ریزآرایه، دستهبندی
|
آدرس
|
دانشگاه یزد، پردیس فنی و مهندسی, گروه مهندسی کامپیوتر, ایران, دانشگاه یزد، پردیس فنی و مهندسی, گروه مهندسی کامپیوتر, ایران, دانشگاه اردکان, دانشکده فنی و مهندسی, گروه مهندسی کامپیوتر, ایران, دانشگاه یزد، پردیس فنی و مهندسی, گروه مهندسی کامپیوتر, ایران
|
|
|
|
|
|
|
|
|
|
|
Diagnosis of Breast Cancer Subtypes using the Selection of Effective Genes from Microarray Data
|
|
|
Authors
|
Tabatabaei Abolfazl ,Derhami Vali ,Sheikhpour Razieh ,Pajoohan Mohammad Reza
|
Abstract
|
Introduction: Early diagnosis of breast cancer and the identification of effective genes are important issues in the treatment and survival of the patients. Gene expression data obtained using DNA microarray in combination with machine learning algorithms can provide new and intelligent methods for diagnosis of breast cancer.Methods: Data on the expression of 9216 genes from 84 patients across 5 different types of cancer was obtained using microarray technology. In this study, we proposed a feature selection method based on the correlation between abnormal expression of genes and cancer for diagnosis of breast cancer. Then, we used Knearest neighbor (KNN), support vector machine (SVM), and naive Bayesian (NB) classifiers to evaluate the performance of the proposed method in the selection of relevant genes.Results: The proposed feature selection method coupled with the KNN classifier predicted all types of cancer with 100% accuracy and using 38 of the 9216 genes. The proposed method could also identify the genes associated with each class. Moreover, the proposed feature selection method coupled with NB and SVM classifiers achieved accuracy rates of 90% and 96.67% using 17 and 22 genes, respectively.Conclusion: The results of this study demonstrated that the proposed feature selection method has better performance compared with other methods. The proposed method is able to distinguish the genes involved in each cancer class and detect overexpression or underexpression of selected genes, which can be used by physicians and researchers in the field of health care.
|
Keywords
|
Breast Cancer ,Feature Selection ,Microarray Data ,Classification
|
|
|
|
|
|
|
|
|
|
|