|
|
طراحی سیستم تصمیم یار بالینی تشخیص سرطان پستان: رویکردی مبتنی بر داده کاوی
|
|
|
|
|
نویسنده
|
شنبه زاده مصطفی ,کاظمی آرپناهی هادی ,نوپور رئوف
|
منبع
|
پياورد سلامت - 1401 - دوره : 16 - شماره : 2 - صفحه:145 -158
|
چکیده
|
زمینه و هدف: سرطان پستان یکی از رایجترین و تهاجمیترین بدخیمیها در خانمها میباشد. تشخیص بهموقع سرطان پستان نقش مهمی در جلوگیری از پیشرفت این بیماری، اقدامات درمانی بهموقع و در نتیجه کاهش میزان مرگومیر این بیماران دارد. یادگیری ماشین، قابلیت بالایی در تشخیص سریع و هزینه اثربخش بیماریها دارد. هدف این مطالعه، طراحی سیستم تصمیمیار بالین (cdss) clinical decision support system بر اساس قوانین استخراجشده از الگوریتم منتخب درخت تصمیم با بهترین عملکرد بهمنظور تشخیص بهموقع و موثر سرطان پستان است. روش بررسی: دادههای 597 فرد مشکوک به سرطان پستان(255 بیمار مبتلا و 342 فرد سالم) بهصورت گذشتهنگر از پایگاه داده الکترونیکی بیمارستان آیتالله طالقانی شهر آبادان در قالب 24 ویژگی عمدتاً سبک زندگی و سوابق پزشکی استخراج شد. پس از انتخاب مهمترین متغیرها از طریق کای دو پیرسون و تحلیل واریانس یکطرفه(0/05>p)، عملکرد الگوریتمهای منتخب دادهکاوی شامل random forest (rf)، decision stump (ds)،j-48، reptree (rt)، xg-boost برای تشخیص سرطان پستان در بستر نرمافزار 3.4 weka تحلیل شد. در نهایت سیستم تشخیصی سرطان پستان بر اساس بهترین مدل و از طریق زبان برنامهنویسی سی شارپ و چارچوب 3.5.4 dot net framework طراحی گردید. یافتهها: 14 متغیر شامل سابقهی فردی سرطان پستان، سابقهی نمونهبرداری از سینه، سابقهی رادیوگرافی از قفسهی سینه، سابقهی فشارخون، افزایش کلسترول خون ldl (lowdensity lipoprotein)، وجود توده در ربع فوقانی داخلی سینه، هورموندرمانی با استروژن، هورموندرمانی با استروژنپروژسترون، سابقهی خانوادگی سرطان پستان، سن، سابقهی سرطانهای دیگر، نسبت اندازهی دور کمر به دور باسن و مصرف میوه و سبزی ارتباط معناداری را باکلاس خروجی در سطح 05/0>p نشان دادند. بر اساس نتایج حاصل از ارزیابی عملکرد الگوریتمهای منتخب، مدل rf با میزان حساسیت، ویژگی، صحت و اندازه f بهترتیب برابر با 0/97، 0/99، 0/98 و 0/974 و 0/936 =(area under the receiver operator characteristics (roc) curve (auc عملکرد بالاتری نسبت به سایر الگوریتمهای منتخب داشته است و بهعنوان مدل برتر برای تشخیص سرطان پستان پیشنهاد شد. نتیجهگیری: بهنظر میرسد که استفاده از متغیرهای تعدیلپذیر مانند سبک زندگی و ویژگیهای هورمونی-تولیدمثلی بهعنوان ورودی الگوریتم rf برای طراحی cdss بتواند با صحت بهینه موارد سرطان پستان را تشخیص دهد. بهعلاوه سیستم پیشنهادی بهطور موثر در محیطهای واقعی بالینی برای تشخیص سریع و موثر بیماری قابل اقتباس باشد.
|
کلیدواژه
|
سرطان پستان، داده کاوی، مدل تشخیصی، سیستم تصمیمیار بالینی
|
آدرس
|
دانشگاه علوم پزشکی ایلام, دانشکده پیراپزشکی, گروه فناوری اطلاعات سلامت, ایران, دانشگاه علوم پزشکی آبادان, دانشکده مدیریت و اطلاع رسانی پزشکی, گروه فناوری اطلاعات سلامت, ایران, دانشگاه علوم پزشکی ایران, دانشکده مدیریت و اطلاع رسانی پزشکی, ایران
|
پست الکترونیکی
|
nopoor.r@iums.ac.ir
|
|
|
|
|
|
|
|
|
design of clinical decision support system to diagnose breast cancer: an approach using data mining
|
|
|
Authors
|
shanbehzadeh mostafa ,kazemi-arpanahi hadi ,nopour raoof
|
Abstract
|
background and aim: breast cancer is one of the most common and aggressive malignancies in women. timely diagnosis of breast cancer plays an important role in preventing the progression of this disease, timely treatment measures, and aftermath reducing the mortality rate of these patients. machine learning has the potential ability to diagnose diseases quickly and costeffectively. this study aims to design a cdss based on the rules extracted from the decision tree algorithm with the best performance to diagnose breast cancer in a timely and effective manner.materials and methods: the data of 597 suspected people with breast cancer (255 patients and 342 healthy people) were retrospectively extracted from the electronic database of ayatollah taleghani hospital in abadan city with 24 characteristics, mainly pertained to lifestyle and medical histories. after selecting the most important variables by using the chisquare pearson and oneway analysis of variance (p<0.05), the performance of selected data mining algorithms including rf, j48, ds, rt and xg boost was evaluated for breast cancer diagnosis in weka 3.4 software. finally, the breast cancer diagnostic system was designed based on the best model and through c# programming language and dot net framework v3.5.4.results: fourteen variables including personal history of breast cancer, breast sampling, and chest xray, high blood pressure, increased ldl blood cholesterol, presence of mass in upper inner quadrant of the breast, hormone therapy with estrogen, hormone therapy with estrogenprogesterone, family history of breast cancer, age, history of other cancers, waisttohip ratio and fruit and vegetable consumption showed a significant relationship with the output class at the p<0.05. based on the results of the performance evaluation of selected algorithms, the rf model with sensitivity, specificity, accuracy, and f measure equal to 0.97, 0.99, 0.98, 0.974, respectively, auc=0.936 had higher performance than other selected algorithms and was suggested as the best model for breast cancer diagnosis.conclusion: it seems that using modifiable variables such as lifestyle and reproductivehormonal characteristics as input to the rf algorithm to design the cdss, can detect breast cancer cases with optimal accuracy. in addition, the proposed system can be effectively adapted in real clinical environments for quick and effective disease diagnosis.
|
Keywords
|
breast cancer ,data mining ,diagnostic model ,clinical decision support system
|
|
|
|
|
|
|
|
|
|
|