>
Fa   |   Ar   |   En
   مدل‌سازی و پیش‌بینی احتمال ابتلاء به بیماری‌ قلبی عروق کرونری با استفاده از الگوریتم‌های داده‌کاوی  
   
نویسنده سعدی پریا ,زینال نژاد معصومه ,موحدی سبحانی فرزاد
منبع انفورماتيك سلامت و زيست پزشكي - 1400 - دوره : 8 - شماره : 2 - صفحه:193 -207
چکیده    مقدمه: بیماری قلبی عروق کرونری یکی از شایع‌ترین علت‌های مرگ‌ومیر در بزرگ‌سالان است، درحالی‌که، با تشخیص سریع و دقیق، درمان به‌موقع و نجات بیمار تا حد زیادی امکان‌پذیر است. از این‌رو، هدف این پژوهش شناسایی فاکتورهای موثر در ابتلاء به این بیماری و ارائه مدلی داده‌محور جهت کمک به پزشکان در پیش‌بینی و تشخیص آن است.روش: پژوهش حاضر از نوع تحقیق کاربردی-توسعه‌ای است که در آن 2038 رکورد گردآوری شده در مدت 5 سال در بیمارستان قلب شهید رجایی تهران، طی عملیات پیش‌پردازش و آماده‌سازی، با استفاده از نمونه‌برداری تصادفی متوازن، به 1000 رکورد، 500 بیمار و 500 فرد سالم، کاهش یافت. مرور ادبیات تحقیق، مشاوره با پزشکان متخصص، و وزن‌دهی با استفاده از روش کای‌دو، منجر به تعیین ویژگی‌ها شد. مدل‌ها با استفاده از الگوریتم‌های ماشین بردار پشتیبان، شبکه عصبی و جنگل تصادفی در محیط نرم‌افزارهای رپیدماینر و پایتون ایجاد شدند.نتایج: در میان 35 متغیر شناسایی شده، مهم‌ترین ویژگی‌ها عبارت‌اند از بیماری دریچه‌های قلبی، درد قفسه سینه، کلسترول بد، اختلال حرکت دیواره‌ای قلب، تری‌گلیسیرید، سدیم، پتاسیم، فشارخون و وزن. معیار f، دقت، صحت، و بازخوانی، به ترتیب، برای الگوریتم‌ جنگل تصادفی برابر با 82/11%، 81/40%، 79/07%، 85/40% و نرخ خطای مدل 18/6% محاسبه شد.نتیجه‌گیری: جنگل تصادفی با دقت قابل قبولی احتمال ابتلاء به بیماری قلبی عروق کرونری را پیش‌بینی نمود. در مقایسه مدل‌ها، به علت زیاد بودن تعداد گره‌های ورودی، خطای مدل شبکه عصبی، 23/6%، نسبتاً بیشتر بود.
کلیدواژه بیماری قلبی -عروق کرونری، پیش‌بینی، ماشین بردار پشتیبان، شبکه عصبی، جنگل تصادفی
آدرس دانشگاه آزاد اسلامی واحد علوم و تحقیقات تهران, دانشکده فنی و مهندسی, گروه مهندسی صنایع, ایران, دانشگاه آزاد اسلامی واحد تهران غرب, دانشکده فنی و مهندسی, گروه مهندسی صنایع, ایران, دانشگاه آزاد اسلامی واحد علوم و تحقیقات تهران, دانشکده فنی و مهندسی, گروه مهندسی صنایع, ایران
پست الکترونیکی fmovahedi@iau.ac.ir
 
   Modeling and Predicting the Risk of Coronary Artery Disease Using Data Mining Algorithms  
   
Authors Saadi Paria ,Zeinalnezhad Masoomeh ,Movahedi Sobhani Farzad
Abstract    Introduction: Coronary artery disease (CAD) is one of the most common causes of death in adults while accurate and early diagnosis can lead to treatment and survival of patients to a great extent. Therefore, the objective of this study was to identify the effective factors leading to this disease and develop a datadriven model to assist physicians in predicting and diagnosing it.Method: This is an applied research, considering 2038 medical records, collected from Shahid Rajaei Heart Hospital in Tehran, during 5 years. A data preprocessing was carried out and random balanced sampling reduced the dataset into 1000 records, with 500 CAD and 500 Normal. Literature review, consultation with specialist physicians, and weighting using the Chisquare method led to the determination of important features. Support Vector Machine, Neural Network and Random Forest algorithms were applied in RapidMiner and Python.Results: Among the 35 identified variables, the most important features included VHD, Chest pain, LDL, RWMA, TG, Na, K, BP, and weight. The Fmeasure, precision, accuracy, and recall for random forest algorithm were calculated as 82.11%, 81.40%, 79.07%, and 85.40%, respectively, and the error rate was 18.6%.Conclusion: Random Forest predicted the risk of CAD with a reasonable precision. In comparison, due to the large number of input nodes, the error rate of the Neural Network model was relatively higher (23.6%).
Keywords Coronary Artery Disease ,Prediction ,Support Vector Machine ,Neural Network ,Random Forest
 
 

Copyright 2023
Islamic World Science Citation Center
All Rights Reserved