|
|
مدلسازی و پیشبینی احتمال ابتلاء به بیماری قلبی عروق کرونری با استفاده از الگوریتمهای دادهکاوی
|
|
|
|
|
نویسنده
|
سعدی پریا ,زینال نژاد معصومه ,موحدی سبحانی فرزاد
|
منبع
|
انفورماتيك سلامت و زيست پزشكي - 1400 - دوره : 8 - شماره : 2 - صفحه:193 -207
|
چکیده
|
مقدمه: بیماری قلبی عروق کرونری یکی از شایعترین علتهای مرگومیر در بزرگسالان است، درحالیکه، با تشخیص سریع و دقیق، درمان بهموقع و نجات بیمار تا حد زیادی امکانپذیر است. از اینرو، هدف این پژوهش شناسایی فاکتورهای موثر در ابتلاء به این بیماری و ارائه مدلی دادهمحور جهت کمک به پزشکان در پیشبینی و تشخیص آن است.روش: پژوهش حاضر از نوع تحقیق کاربردی-توسعهای است که در آن 2038 رکورد گردآوری شده در مدت 5 سال در بیمارستان قلب شهید رجایی تهران، طی عملیات پیشپردازش و آمادهسازی، با استفاده از نمونهبرداری تصادفی متوازن، به 1000 رکورد، 500 بیمار و 500 فرد سالم، کاهش یافت. مرور ادبیات تحقیق، مشاوره با پزشکان متخصص، و وزندهی با استفاده از روش کایدو، منجر به تعیین ویژگیها شد. مدلها با استفاده از الگوریتمهای ماشین بردار پشتیبان، شبکه عصبی و جنگل تصادفی در محیط نرمافزارهای رپیدماینر و پایتون ایجاد شدند.نتایج: در میان 35 متغیر شناسایی شده، مهمترین ویژگیها عبارتاند از بیماری دریچههای قلبی، درد قفسه سینه، کلسترول بد، اختلال حرکت دیوارهای قلب، تریگلیسیرید، سدیم، پتاسیم، فشارخون و وزن. معیار f، دقت، صحت، و بازخوانی، به ترتیب، برای الگوریتم جنگل تصادفی برابر با 82/11%، 81/40%، 79/07%، 85/40% و نرخ خطای مدل 18/6% محاسبه شد.نتیجهگیری: جنگل تصادفی با دقت قابل قبولی احتمال ابتلاء به بیماری قلبی عروق کرونری را پیشبینی نمود. در مقایسه مدلها، به علت زیاد بودن تعداد گرههای ورودی، خطای مدل شبکه عصبی، 23/6%، نسبتاً بیشتر بود.
|
کلیدواژه
|
بیماری قلبی -عروق کرونری، پیشبینی، ماشین بردار پشتیبان، شبکه عصبی، جنگل تصادفی
|
آدرس
|
دانشگاه آزاد اسلامی واحد علوم و تحقیقات تهران, دانشکده فنی و مهندسی, گروه مهندسی صنایع, ایران, دانشگاه آزاد اسلامی واحد تهران غرب, دانشکده فنی و مهندسی, گروه مهندسی صنایع, ایران, دانشگاه آزاد اسلامی واحد علوم و تحقیقات تهران, دانشکده فنی و مهندسی, گروه مهندسی صنایع, ایران
|
پست الکترونیکی
|
fmovahedi@iau.ac.ir
|
|
|
|
|
|
|
|
|
Modeling and Predicting the Risk of Coronary Artery Disease Using Data Mining Algorithms
|
|
|
Authors
|
Saadi Paria ,Zeinalnezhad Masoomeh ,Movahedi Sobhani Farzad
|
Abstract
|
Introduction: Coronary artery disease (CAD) is one of the most common causes of death in adults while accurate and early diagnosis can lead to treatment and survival of patients to a great extent. Therefore, the objective of this study was to identify the effective factors leading to this disease and develop a datadriven model to assist physicians in predicting and diagnosing it.Method: This is an applied research, considering 2038 medical records, collected from Shahid Rajaei Heart Hospital in Tehran, during 5 years. A data preprocessing was carried out and random balanced sampling reduced the dataset into 1000 records, with 500 CAD and 500 Normal. Literature review, consultation with specialist physicians, and weighting using the Chisquare method led to the determination of important features. Support Vector Machine, Neural Network and Random Forest algorithms were applied in RapidMiner and Python.Results: Among the 35 identified variables, the most important features included VHD, Chest pain, LDL, RWMA, TG, Na, K, BP, and weight. The Fmeasure, precision, accuracy, and recall for random forest algorithm were calculated as 82.11%, 81.40%, 79.07%, and 85.40%, respectively, and the error rate was 18.6%.Conclusion: Random Forest predicted the risk of CAD with a reasonable precision. In comparison, due to the large number of input nodes, the error rate of the Neural Network model was relatively higher (23.6%).
|
Keywords
|
Coronary Artery Disease ,Prediction ,Support Vector Machine ,Neural Network ,Random Forest
|
|
|
|
|
|
|
|
|
|
|