|
|
|
|
طبقه بندی پنج نوع داده سرطان بر اساس روش های شبکه عصبی و تحلیل و بررسی بیان ژن بر اساس روش همجوشی انتخاب ویژگی
|
|
|
|
|
|
|
|
نویسنده
|
ترکی فرنوش ,خادم عاطفه ,جلالی اقچای عبدالحسین
|
|
منبع
|
مهندسي مكانيك ايران - 1403 - دوره : 26 - شماره : 2 - صفحه:46 -66
|
|
چکیده
|
در داده های میکروآرایه با حجم بالا، تعداد کم نمونه ها و تغییرپذیری ذاتی در فرآیندهای بیولوژیکی باعث ایجاد مشکل افزایش هزینه محاسباتی و پیچیدگی طبقه بندی ها می شود. همچنین تفسیر ژن های عامل بیماری پیچیده است، چرا که از نظر بیولولوژیکی، تنها مجموعه کوچکی از ژن ها می توانند بیماری را با دقت بیشتری توصیف نمایند. اولین قدم در آنالیز داده های میکروآرایه، کاهش قابل توجه تعداد ژن ها یا به عبارتی انتخاب ژن های متمایز کننده در فرآیند طبقه بندی است. این مرحله انتخاب ژن نامیده می شود. در این مقاله از طبقه بندی بیان ژن پنج داده، سرطان روده، سرطان پستان، لوسمی، تومورهای پروستات و لنفوم های سلول های بزرگ پخش شده استفاده شده و هر یک از آن ها به تفکیک در چرخه انتخاب ویژگی و نیز دسته بندی با تعداد ویژگی های متغیر وارد می شوند.
|
|
کلیدواژه
|
یادگیری ماشین، شبکه عصبی، تحلیل ژن های سرطان، طبقه بندی داده ها، بایومکانیک
|
|
آدرس
|
دانشگاه صنعتی خواجه نصیرالدین طوسی, دانشکده مهندسی مکانیک, ایران, دانشگاه صنعتی خواجه نصیرالدین طوسی, دانشکده مهندسی مکانیک, ایران, دانشگاه صنعتی خواجه نصیرالدین طوسی, دانشکده مهندسی مکانیک, ایران
|
|
پست الکترونیکی
|
jalali@kntu.ac.ir
|
|
|
|
|
|
|
|
|
|
|
|
|
classification of five types of cancer data based on neural network methods, and analysis of gene expression using the feature selection fusion method
|
|
|
|
|
Authors
|
turki farnoosh ,khadem atefeh ,jalali aghchai abdolhossein
|
|
Abstract
|
in high-volume microarray data, the small number of samples and inherent variability in biological processes cause the problem of increasing computational cost and complexity of classifications. also, the interpretation of disease-causing genes is complicated, because biologically, only a small set of genes can describe the disease more accurately. the first step in the analysis of microarray data is to significantly reduce the number of genes, or in other words, to select discriminating genes in the classification process. this step is called gene selection. in this article, gene expression classification of three types of data, colon cancer, breast cancer, leukemia, prostate tumors, and dlbcl are used, and each of them is separated in the feature selection cycle and also categorized with variable number of features. results show the nn method had the best accuracy and performance among the classification methods for all four types of data.
|
|
Keywords
|
data classification ,machine learning ,neural network ,cancer analysis
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|