|
|
مقایسهی کارایی الگوریتمهای دادهکاوی در پیشبینی تشخیص بیماری دیابت
|
|
|
|
|
نویسنده
|
دکامینی فاطمه ,احسانی فر محمد
|
منبع
|
ديابت و متابوليسم ايران - 1400 - دوره : 21 - شماره : 4 - صفحه:264 -275
|
چکیده
|
مقدمه: دیابت یکی از مشکلات اساسی سلامت در ایران بوده و حدود 4.6 میلیون نفر از بزرگسالان به این بیماری مبتلا هستند. ضعف در تشخیص این بیماری سبب شده نیمی از این تعداد از بیماری خود اطلاعی نداشته باشند. در سالیان اخیر همزمان با بهکارگیری رایانه در تحلیل و ذخیرهسازی اطلاعات، حجم و پیچیدگی دادهها بهصورت چشمگیری افزایش یافته است.روشها: در سازمانهای سلامت دادهها نقش اساسی در ارزش سازمان ایفا میکنند. از اینرو دادهکاوی به یکی از پُرکاربردترین فرآیندها در حوزهی سلامت و تشخیص بیماریها تبدیل شده است. در این پژوهش اطلاعات 768 نفر از مراجعین آزمایشگاهی در تهران با حفظ محرمانگی و برای شناسایی متغیرهای تاثیرگذار در ابتلا به بیماری دیابت از نظرات خبرگان استفاده شده است. یافتهها: یافتهها حاکی از بررسی 5 الگوریتم مورد نظر بر روی دادههای ارائه شده است که با پیادهسازی 5 الگوریتم دادهکاوی j48، بیز، بگینگ، کوهن و خوشهبندی ساده جهت دستهبندی دادهها، کارایی این الگوریتمها از نظر سرعت و دقت در محاسبات بررسی گردید. نتیجهگیری: مجموعه دادهها جهت دسته بندی، بانک دادههای یک آزمایشگاه است که این مجموعه شامل 768 نمونه با 9 مشخصه است. نهایتاً الگوریتم j48 بهدلیل سرعت بالا، دقت مورد قبول و عدم وجود حساسیت به دادههای اولیه، جهت دادهکاوی دادههای بیماری دیابت پیشنهاد میشود.
|
کلیدواژه
|
داده کاوی، دیابت، کارایی، کشف دانش
|
آدرس
|
دانشگاه آزاد اسلامی واحد اراک, دانشکده ی مدیریت, گروه مدیریت صنعتی, ایران, دانشگاه آزاد اسلامی واحد اراک, دانشکده ی فنی مهندسی, گروه مهندسی صنایع, ایران
|
|
|
|
|
|
|
|
|
|
|
Comparison of the Efficiency of Data Mining Algorithms in Predicting the Diagnosis of Diabetes
|
|
|
Authors
|
Dekamini Fatemeh ,Ehsanifar Mohammad
|
Abstract
|
Background: Diabetes is one of the major health problems in Iran and about 4.6 million adults suffer from this disease. Poor diagnosis of this disease has caused half of this number to be unaware of their disease. In recent years, along with the use of computers in data analysis and storage, the volume and complexity of data has increased dramatically.Methods: In health organizations, data play an essential role in the value of the organization. Therefore, data mining has become one of the most widely used processes in the field of health and disease diagnosis. In this study, the information of 768 laboratory clients in Tehran was kept confidential and the opinions of experts were used to identify the variables affecting the incidence of diabetes.Results: The findings indicate the study of 5 algorithms on the presented data, which by implementing 5 data mining algorithms J48, Bayes, Beginning, Cohen and simple clustering to classify the data, the efficiency of these algorithms in terms of speed and accuracy in calculations was evaluated.Conclusion: The data set for classification is the database of a laboratory, which includes 768 samples with 9 characteristics. Finally, J48 algorithm is recommended for data mining of diabetes due to high speed, acceptable accuracy and lack of sensitivity to raw data.
|
Keywords
|
Data Mining ,Diabetes ,Efficiency ,Knowledge Discovery
|
|
|
|
|
|
|
|
|
|
|