|
|
شبکه های عصبی پیچشی حساس به هزینه برای طبقه بندی زیرگروه های سرطان
|
|
|
|
|
نویسنده
|
هاشمی عالم راضیه ,شمسی محبوبه ,آقایی مجید
|
منبع
|
محاسبات و سامانه هاي توزيع شده - 1401 - دوره : 5 - شماره : 1 - صفحه:15 -21
|
چکیده
|
طبقه بندی زیرگروه های سرطان وظیفه بسیار مهمی برای تشخیص و پیش آگهی سرطان است. در سال های اخیر، روش های یادگیری عمیق به همین دلیل محبوبیت قابل توجهی به دست آورده اند. بااین حال، تعیین ساختار شبکه عصبی دشوار است زیرا عملکرد شبکه عمیق تا حد زیادی به ساختار آن بستگی دارد. عالوه بر این، تعداد بالای ژن ها در پایگاه داده بیان ژن و عدم تعادل داده ها بین طبقات مختلف تاثیر مستقیمی بر پیچیدگی و عملکرد مدل های طبقه بندی زیرگروه سرطان دارد. برای پرداختن به مشکل داده های نامتعادل، یک مدل شبکه عصبی کانولوشن (cnn )با استفاده از یک استراتژی حساس به هزینه برای افزایش دقت مدل در شناسایی کلاس های اقلیت پیشنهادشده است. از سوی دیگر، از تکنیک ضریب فیشر برای کاهش ژن ها در مرحله پیش پردازش استفاده میشود. در روش حساس به هزینه، ماتریس هزینه بر اساس توزیع کلاس ها ایجاد می شود و سپس از این ماتریس در مرحله تابع هزینه شبکه cnn برای محاسبه میزان خطا استفاده می شود. دو مجموعه از مجموعه داده های سرطان برای ارزیابی روش پیشنهادی استفاده می شود. نتایج با استفاده از سه معیار دقت، فراخوانی و دقت مقایسه می شوند. نتایج نشان میدهد که انتخاب ژنهای مناسب برای طبقه بندی به همراه استفاده از یادگیری حساس به هزینه برای این منظور می تواند عملکرد روش پیشنهادی نسبت به مدل cnn بدون انتخاب ویژگی و یادگیری حساس به هزینه حدود 11 ،%10 %و 18 %به ترتیب برای دقت، فراخوانی و صحت افزایش دهد
|
کلیدواژه
|
دسته بندی داده ها ی نامتوازن زیرگروه های سرطان داده های بیان ژن یادگیری عمیق cnn
|
آدرس
|
صنعتی قم, ایران, صنعتی قم, ایران, صنعتی قم, ایران
|
پست الکترونیکی
|
aghaee@qut.ac.ir
|
|
|
|
|
|
|
|
|
a cost-sensitive convolution neural network for cancer subgroups classification
|
|
|
Authors
|
hashemi alam -razieh ,shamsi mahbobeh ,aghaee majid
|
Abstract
|
classification of cancer subtypes is very important task for the diagnosis and prognosis of cancer. in recent years, deep learning methods have gained considerable popularity for this reason; however, it is difficult to determine the structure of the neural network because the function of the deep network depends largely on its structure. in addition, the high number of genes in the gene expression database and the imbalanced data between different classes have a direct effect on the complexity and performance of cancer subgroup classification models. to address the problem of unbalanced data, a convolution neural network (cnn) model using a cost-sensitive strategy is proposed to increase the model's accuracy in identifying minority classes. on the other hand, the fisher ratio technique is used to reduce genes in the preprocessing stage. in techniques the cost-sensitive method, a cost matrix is created based on the distribution of classes, and then this matrix is used in the cnn network cost function step to calculate the amount of error. two sets of cancer datasets are used to evaluate the proposed method. the results show that selecting the appropriate genes for classification along with the use of cost-sensitive learning can increase the performance of the proposed method compared to the cnn model without selecting the feature and cost-sensitive learning about 11%, 10% and 18% in terms of three criteria of accuracy, recall and precision, respectively.
|
Keywords
|
classification ,imbalanced data ,cancer subgroups ,gene expression ,convolution neural networks ,cost-sensitive learning
|
|
|
|
|
|
|
|
|
|
|