|
|
تشخیص بیماری دیابت با استفاده از روش رده بند تقویتی کت بوست و بیزی
|
|
|
|
|
نویسنده
|
احمدیان زهرا ,اسکندری فرزاد
|
منبع
|
انديشه آماري - 1402 - دوره : 28 - شماره : 1 - صفحه:43 -54
|
چکیده
|
امروزه تشخیص بیماری ها با استفاده از هوش مصنوعی و الگوریتم های یادگیری ماشین از اهمیت بسیار بالایی برخوردار است، چرا که با استفاده از دادههای موجود در زمینه مطالعاتی بیماری مورد نظر میتوان به اطلاعات و نتایج سودمندی دست یافت که از رخداد بسیاری از مرگ ومیرها میکاهد. از جمله این بیماریها میتوان به تشخیص بیماری دیابت که امروزه با توجه به رشد زندگی شهرنشینی و کاهش فعالیت افراد گسترش یافته است، اشاره کرد. پس تشخیص این موضوع که فرد به بیماری دیابت مبتلا میگردد یا خیر از اهمیت بسیار بالایی برخوردار است. در این مقاله از مجموعه داده مربوط به اطلاعات افرادی که آزمایش تشخیص دیابت را انجام دادهاند استفاده شده است. این اطلاعات مربوط به 520 نفر است، عمل ردهبندی افراد به دو دسته که آیا نتیجه آزمایش دیابتشان مثبت است یا خیر صورت میگیرد و از روشهای ردهبند بیزی مانند ماشین بردار پشتیبان بیزی، بیز ساده، cn$ و روش ردهبند ترکیبی کتبوست استفاده شده است تا بتوان نتیجه گرفت که کدام یک از این روشها میتوانند توانمندی بهتری برای تحلیل دادهها داشته باشند و همچنین برای مقایسه این روشها از معیارهای دقت، صحت، وضوح، حساسیت و نمودار راک استفاده شده است.
|
کلیدواژه
|
رده بندی، رده بندی ترکیبی، رده بندی بیزی
|
آدرس
|
دانشگاه علامه طباطبائی, ایران, دانشگاه علامه طباطبائی, گروه آمار, ایران
|
پست الکترونیکی
|
askandari@atu.ac.ir
|
|
|
|
|
|
|
|
|
diagnosing diabetes using catboost and bayesian methods
|
|
|
Authors
|
ahmadian zahra ,eskandari farzad
|
Abstract
|
today, the diagnosis of diseases using artificial intelligence and machine learning algorithms are of great importance, because by using the data available in the study field of the desired disease, useful information and results can be obtained that reduce the occurrence of many deaths. among these diseases, we can mention the diagnosis of diabetes, which has spread today due to the growth of urban life and the decrease in people’s activity. so, it is very important to know whether a person is suffering from diabetes or not. in this article, the data set related to the information of people who have done the diabetes diagnosis test is used, this information is related to 520 people. people are classified into two groups based on whether their diabetes test result is positive or not, and bayesian classification methods such as bayesian support vector machine, naive bayes, cnk and catboost ensemble classification method have been used to conclude which of these the methods can have a better ability to analyze the data and also to compare these methods use accuracy, precision, f1-score, recall, roc diagram.
|
Keywords
|
classification ,bayesian classification ,ensemble classification
|
|
|
|
|
|
|
|
|
|
|