>
Fa   |   Ar   |   En
   پیش‌بینی بیماری مولتیپل اسکلروزیس با استفاده از رویکردهای داده‌کاوی جنگل تصادفی و ماشین‌بردار پشتیبان بر اساس الگوریتم ژنتیک  
   
نویسنده هاشمیان امیرحسین ,منوچهری سارا ,افشاری داریوش ,منوچهری زهره ,سالاری نادر ,شهسواری سوده
منبع مجله دانشكده پزشكي دانشگاه علوم پزشكي تهران - 1398 - دوره : 77 - شماره : 1 - صفحه:33 -40
چکیده    زمینه و هدف: مولتیپل اسکلروزیس (ms) یک بیماری التهابی تخریب کننده است که روش مهم تشخیص آن استفاده از دستگاه magnetic resonance imaging (mri) است، اما ازآنجاکه mri از یک میدان مغناطیسی بسیار پرقدرت استفاده می کند، در صورت وجود اجسام فلزی در بدن بیماران باعث ایجاد اختلال در وضعیت سلامت بیمار، کارکرد دستگاه و نیز انحراف و تاری در تصاویر می شود. با توجه به چنین محدودیتی در استفاده از دستگاه mri نیاز به روش کمک غربالگری احساس می شود. بنابراین این مطالعه با هدف مقایسه دو مدل ماشین بردار پشتیبان (support vector machine, svm) و جنگل تصادفی (random forest, rf) انجام شد.روش بررسی: پژوهش کنونی تحلیلی و از نوع مدل سازی بود که از اردیبهشت 1396 تا شهریور 1397 در دانشکده بهداشت دانشگاه علوم پزشکی کرمانشاه انجام شد. روش پیشنهادی پژوهش بر روی مجموعه داده های بیماری ms که مشخصات آن ها در سیستم ثبت سلامت دانشگاه علوم پزشکی کرمانشاه ثبت گردیده، پیاده سازی شد. تعداد افراد مورد مطالعه 317 نفر بودند (188 نفر مبتلابه بیماری ms و 128 نفر فاقد آن). به منظور برازش مدل svm، از تابع کرنل شعاع مبنا (radial basis function, rbf) که پارامترهای آن با الگوریتم ژنتیک (genetic algorithm, ga) بهینه سازی شده اند، استفاده شد. سپس مدل svm با استفاده از معیارهای صحت، حساسیت و ویژگی با مدل rf مقایسه گردید.یافته ها: بر اساس نتایج، صحت، حساسیت و ویژگی مدل svm به ترتیب 0/79، 0/80، 0/78 و برای مدل rf به ترتیب 0/76، 0/81، 0/70 به دست آمد. نتیجه گیری: دو مدل عملکرد مناسبی داشتند، اما با توجه به صحت به عنوان یک معیار مهم برای مقایسه عملکرد مدل ها در این حوزه، می توان گفت مدل svm کارایی بهتری نسبت به rf در تشخیص بیماری ms داشت.
کلیدواژه الگوریتم ژنتیک، مولتیپل اسکلروزیس، جنگل تصادفی، ماشین‌بردار پشتیبان
آدرس دانشگاه علوم پزشکی کرمانشاه, دانشکده بهداشت، مرکز تحقیقات عوامل محیطی موثر بر سلامت, گروه آمار زیستی, ایران, دانشگاه علوم پزشکی کرمانشاه, دانشکده بهداشت، کمیته تحقیقات دانشجویی, گروه آمار زیستی, ایران, دانشگاه علوم پزشکی کرمانشاه, دانشکده پزشکی, گروه نورولوژی, ایران, دانشگاه علوم پزشکی همدان, کمیته تحقیقات دانشجویی, گروه آمار زیستی, ایران, دانشگاه علوم پزشکی کرمانشاه, دانشکده بهداشت, گروه آمار زیستی, ایران, دانشگاه علوم پزشکی کرمانشاه, دانشکده پیراپزشکی, گروه مدیریت اطلاعات سلامت, ایران
 
   Prognosis of multiple sclerosis disease using data mining approaches random forest and support vector machine based on genetic algorithm  
   
Authors Hashemian Amir Hossein ,Afshari Daryoush ,Salari Nader ,Manochehri Sara ,Shahsavari Soodeh ,Manochehri Zohreh
Abstract    Background: Multiple sclerosis (MS) is a degenerative inflammatory disease which is most commonly diagnosed by magnetic resonance imaging (MRI). But, since the MRI device uses of a magnetic field, if there are metal objects in the patient's body, it can disrupt the health of the patient, the functioning of the MRI, and distortion in the images. Due to limitations of using MRI device, screening seems necessary for those patients who have metal objects in their bodies. Therefore, this study is carried out to compare two models: support vector machine and random forest.Methods: This analyticalmodelling research was implemented on MS data collection, the specifications of which are recorded in health registry system in School of Public Health, Kermanshah University of Medical Sciences, Iran, from May 2017 to August 2018. For the purpose of this study, a total of 317 subjects were selected as a sample; 188 subjects were diagnosed with MS and 128 subjects showed no symptoms of MS. In order to fit the support vector machine (SVM) model, radial basis kernel function was used. The parameters of this machine were optimized with genetic algorithm. After this step, the support vector machine and random forest (RF) were compared with respect to three factors: accuracy, sensitivity, and specificity.Results: Based upon the obtained results of study, accuracy, sensitivity, and specificity of SVM were 0.79, 0.80, and 0.78, respectively. In comparison, accuracy, sensitivity, and specificity of RF were found to be 0.76, 0.81, and 0.70, respectively.Conclusion: In general, both models which were compared in current study showed desirable performance; however, in term of accuracy, as an important criteria for performance comparison in this area of research, it can be argued that support vector machine can do better than random forest in diagnosing multiple sclerosis.
Keywords genetic algorithm ,multiple sclerosis ,random forest ,support vector machine
 
 

Copyright 2023
Islamic World Science Citation Center
All Rights Reserved