|
|
مقایسه روشهای مختلف یادگیری ماشین در تشخیص پرفشاری خون در بیماران دیابتی با و بدون در نظر گرفتن هزینهها
|
|
|
|
|
نویسنده
|
تیموری مهدی ,ابراهیمی الهام ,علوی نیا محمد
|
منبع
|
اپيدميولوژي ايران - 1394 - دوره : 11 - شماره : 4 - صفحه:46 -54
|
چکیده
|
مقدمه و اهداف: بیماران دیابتی همواره در معرض ابتلا به پرفشاری خون هستند. هدف از این تحقیق طراحی یک مدل پیش بینی پرفشاری خون در میان افراد مبتلا به دیابت، مبتنی بر هزینه و با در نظر گرفتن توزیع این بیماری در جامعه بود، که تا حد ممکن عملکرد مناسبی داشته باشد.روش کار: در این پژوهش تلاش شد تا با استفاده از روش های مختلف یادگیری ماشین، یک مدل پیش بینی مبتنی بر هزینه طراحی شود که تا حد ممکن بهترین عملکرد در پیش بینی افراد دیابتی در معرض خطر پرفشاری خون را داشته باشد. از میان الگوریتم های داده کاوی، از الگوریتم های درخت تصمیم، ماشین بردار پشتیبانی، شبکه عصبی و نیز رگرسیون لجستیک استفاده شد. برای انجام این پژوهش از داده های مربوط به غربالگری بیماران دیابتی برای تشخیص پرفشاری خون در استان آذربایجان شرقی استفاده شد.یافته ها: افزایش فشار خون سیستول به میزان 130 میلی متر جیوه، فرد دیابتی را بیشتر در معرض پرفشاری خون قرار می دهد. با رویکرد غیر هزینه محور، به شاخص یودن حدود 68 درصد رسیدیم. زمانی که رویکرد هزینه محور به کار بسته می شود، بیشترین شاخص یودن (47.11 درصد) مربوط به شبکه عصبی است، هر چند هدف در اینجا حداقل سازی هزینه است که در راستای این هدف، درخت تصمیم و رگرسیون لجستیک بهترین عملکرد را دارند.نتیجه گیری: در مسائل پیش بینی بیماری ها در جوامع، حساس به هزینه کردن روش ها و در نظر گرفتن توزیع واقعی بیماری در جامعه اهمیت بیش تری دارد تا این که تنها هدف، کمینه کردن تعداد خطاهای دسته بندی روی مجموعه داده ی موجود باشد.
|
کلیدواژه
|
فشار خون، دیابت، یادگیری ماشین، دستهبندی، روشهای حساس به هزینه
|
آدرس
|
دانشگاه تهران, دانشکده علوم و فنون نوین, گروه علوم و فناوری شبکه, ایران, دانشگاه تهران, دانشکده علوم و فنون نوین, گروه علوم و فناوری شبکه, ایران, دانشگاه علوم پزشکی خراسان شمالی, مرکز تحقیقات بیماریهای منتقله بهوسیله ناقلین, ایران
|
|
|
|
|
|
|
|
|
|
|
Comparison of Various Machine Learning Methods in Diagnosis of Hypertension in Diabetics with/without Consideration of Costs
|
|
|
Authors
|
Teimouri M ,Ebrahimi E ,Alavinia M
|
Abstract
|
Background and Objectives: Diabetic patients are always at risk of hypertension. In this paper, the main goal was to design a native cost sensitive model for the diagnosis of hypertension among diabetics considering the prior probabilities.Methods: In this paper, we tried to design a cost sensitive model for the diagnosis of hypertension in diabetic patients, considering the distribution of the disease in the general population. Among the data mining algorithms, Decision Tree, Artificial Neural Network, KNearest Neighbors, Support Vector Machine, and Logistic Regression were used. The data set belonged to AzarbayjaneSharqi, Iran.Results: For people with diabetes, a systolic blood pressure more than 130 mm Hg increased the risk of hypertension. In the noncostsensitive scenario, Youden's index was around 68%. On the other hand, in the costsensitive scenario, the highest Youden's index (47.11%) was for Neural Network. However, in the costsensitive scenario, the value of the imposed cost was important, and Decision Tree and Logistic Regression show better performances.Conclusion: When diagnosing a disease, the cost of missclassifications and also prior probabilities are the most important factors rather than only minimizing the error of classification on the data set.
|
Keywords
|
|
|
|
|
|
|
|
|
|
|
|