|
|
تشخیص بیماری دیابت با استفاده از الگوریتم جنگل تصادفی
|
|
|
|
|
نویسنده
|
مشرف زاده صادق ,روایی بهمن ,کوزه گر احسان اله
|
منبع
|
ديابت و متابوليسم ايران - 1400 - دوره : 21 - شماره : 2 - صفحه:92 -100
|
چکیده
|
مقدمه: دیابت چهارمین عامل مرگ و میر در دنیا است. و از آنجایی که بسیاری از مردم جهان به این بیماری مبتلا و یا در معرض خطر آن هستند، میتوان دیابت را بیماری قرن نامید. دیابت تاثیرات مخربی بر سلامتی افراد جامعه دارد و در صورت تشخیص دیر هنگام، میتواند صدمات جبرانناپذیری به بینایی، کلیهها، قلب، شریانها و غیره وارد کند. بنابراین لازم است که روشهایی برای تشخیص این بیماری در مراحل اولیه وجود داشته باشد. در این مقاله، از دادهکاوی در تشخیص دیابت استفاده شده است. روشها: الگوریتم اصلی مورد استفاده در این مقاله، الگوریتم جنگل تصادفی است. برای بررسی کارایی الگوریتم پیشنهادی در تشخیص بیماری دیابت از مجموعه دادههایی استفاده شده است که شامل 768 نمونه (بیمار) و دارای 8 ویژگی بوده است. از آنجایی که الگوریتم جنگل تصادفی یک الگوریتم ترکیبی است و از چندین درخت تصمیم ایجاد شده است، باعث رسیدن به دقت بالایی در تشخیص بیماری دیابت میگردد.یافتهها: با استفاده از این الگوریتم توانستیم میزان دقت تشخیص بیماری دیابت را به 99.86 % افزایش دهیم.نتیجهگیری: برای تشخیص دیابت از الگوریتمهای مختلفی استفاده شده است ما سعی کردیم از الگوریتمی استفاده کنیم که نسبت به بقیه الگوریتمها برای تشخیص این بیماری از میزان دقت بسیار بالایی برخوردار باشد.
|
کلیدواژه
|
بیماری، دادهکاوی، دیابت، الگوریتم جنگل تصادفی
|
آدرس
|
دانشگاه یاسوج, دانشکده ی فنی و مهندسی, گروه کامپیوتر, ایران, دانشگاه یاسوج, دانشکده ی فنی و مهندسی, گروه کامپیوتر, ایران, دانشگاه گیلان, دانشکده ی فنی و مهندسی شرق گیلان, گروه کامپیوتر, ایران
|
|
|
|
|
|
|
|
|
|
|
Diagnosis of Diabetes Using a Random Forest Algorithm
|
|
|
Authors
|
Moshrefzadeh Sadegh ,Ravaei Bahman ,Kozegar Ehsan
|
Abstract
|
Background: Diabetes is the fourth leading cause of death in the world. And because so many people around the world have the disease, or are at risk for it, diabetes can be called the disease of the century. Diabetes has devastating effects on the health of people in the community and if diagnosed late, it can cause irreparable damage to vision, kidneys, heart, arteries and so on. Therefore, it is necessary to have methods to diagnose this disease in the early stages. In this article, data mining is used to diagnose diabetes.Methods: The main algorithm used in this paper is the random forest algorithm. To evaluate the efficiency of the proposed algorithm in diagnosing diabetes, a data set was used that included 768 samples (patients) and had 8 characteristics. Because the stochastic forest algorithm is a hybrid algorithm created from several decision trees, it achieves high accuracy in diagnosing diabetes.Results: Using this algorithm, we were able to increase the accuracy of diabetes diagnosis to 99.86%.Conclusion: Diabetes is the fourth leading cause of death in the world. Different algorithms have been used to diagnose this disease. We tried to use an algorithm that has a very high degree of accuracy compared to other algorithms for diagnosing this disease.
|
Keywords
|
Disease ,Data Mining ,Diabetes ,Random Forest Algorithm
|
|
|
|
|
|
|
|
|
|
|