|
|
ارائه مدلی برای تشخیص زیرگروههای سرطان مغز مبتنی بر جنگل تصادفی عمیق و ویژگی های تقویت شده با استفاده از دادههای ژنی
|
|
|
|
|
نویسنده
|
فلاح فهیمه ,زمانی فاطمه
|
منبع
|
مهندسي برق دانشگاه تبريز - 1403 - دوره : 54 - شماره : 1 - صفحه:55 -63
|
چکیده
|
تشخیص نوع بیماری سرطان که به ان زیرگروه گفته میشود در تعیین روند درمان حایز اهمیت فراوانی است. در این مقاله، هدف تشخیص چهار زیرگروه سرطان مغز میباشد. تشخیص زیرگروه بیماری را می توان در قالب یک مسئله طبقهبندی مدل کرد. با توجه به پیشرفتهای چشمگیر صورت گرفته در علم بیوانفورماتیک در استخراج اطلاعات ژنتیکی از بدن انسان، اخیرا از این اطلاعات در توصیف بیماران در یادگیری ماشین استفاده زیادی میشود. در این مقاله از سه نوع داده ژنی شامل mrna، mirna و متیلاسیون dna استفاده شده است. ترکیب منابع مختلف اطالاعاتی در قالب دادههای چندوجهی به جای استفاده از یک منبع اطلاعاتی واحد، به افزایش دقت طبقهبندی اطلاعات منجر میشود. برای استخراج ویژگیهای مطلوبتر از دادههای ژنی، از خودرمزگذار استفاده شده است بطوریکه ویژگی های استخراج شده از خودرمزگذار، بهعنوان تقویت کننده در کنار دادههای ژنی اولیه قرار میگیرند. همچنین جنگل تصادفی بهعنوان یک طبقهبندی کننده در طبقهبندی بیماران بر مبنای دادههای ژنی عملکرد مطلوبی داشته است. با گسترش روشهای عمیق در شبکههای عصبی و عملکرد مطلوب آنها، نسخهای از جنگل تصادفی عمیق با ساختار لایهای ارائه شده است. جنگل تصادفی عمیق دارای این مزیت است که در کنار عملکرد مطلوب در طبقهبندی اطلاعات، تعداد پارامتر محدودی داشته و پیچیدگی محاسباتی آن پایینتر است. در این مقاله از جنگل تصادفی عمیق برای تعیین زیرگروه نوعی از سرطان مغز استفاده شده است. نتایج آزمایشها نشاندهنده عملکرد مطلوب روش پیشنهادی است.
|
کلیدواژه
|
بیوانفورماتیک، طبقه بندی اطلاعات، خودرمزگذار، جنگل تصادفی عمیق، داده های چندوجهی، سرطان مغز
|
آدرس
|
دانشگاه صنعتی نوشیروانی, ایران, دانشگاه صنعتی نوشیروانی, ایران
|
پست الکترونیکی
|
zamani@nit.ac.ir
|
|
|
|
|
|
|
|
|
a model for detection of brain cancer sub-types based on deep random forest and augmented features using genomic data
|
|
|
Authors
|
fallah fahimeh ,zamani fatemeh
|
Abstract
|
diagnosing the type of cancer, which is called the subtype, is very important in determining the treatment process. this paper focuses on the diagnose of the four subtypes of the brain cancer. disease subtype diagnosis can be modeled as a classification problem. due to the significant progress made in bioinformatics in extracting genetic information from the human body, recently this information is widely used in the representing of patients in machine learning. in this paper, three types of genetic information including mrna, mirna and dna methylation are used.it should be noted that combining different information sources in the form of multimodal data instead of using a single information source increases the accuracy of information classification. to extract more desirable features from the original genetic data, auto-encoder has been used so that the features extracted from auto-encoder are concatenated to the original genetic data.random forest has performed well as a classifier in classifying patients based on genetic information. by extending deep methods in neural networks and their good performance, a version of deep random forest with layered structure has been proposed. the deep random forest has the advantage that has a limited number of parameters and lower computational complexity in addition to the optimal performance in information classification. in this paper, deep random forest is used to determine the subtype of a special type of brain cancer. the experiment results show the desired performance of the proposed method.
|
Keywords
|
bioinformatics ,classification ,autoencoder ,deep random forest ,multi-omics data ,brain cancer
|
|
|
|
|
|
|
|
|
|
|