|
|
یک رویکرد جدید مبتنی بر الگوریتم catboost و هوش مصنوعی تفسیرپذیر به منظور تشخیص بیماری کرونا بر اساس علائم بیماری
|
|
|
|
|
نویسنده
|
امامی سمانه ,سیدمومنی علی ,نصیری حمید
|
منبع
|
مدل سازي در مهندسي - 1402 - دوره : 21 - شماره : 74 - صفحه:231 -241
|
چکیده
|
ویروس کرونا که در ماه دسامبر 2019 در شهر ووهان چین دیده شد و به سرعت در سراسر جهان شیوع پیدا کرد، همچنان یک تهدید مهم برای سلامت جهان به شمار میآید. علیرغم همه استراتژیهای مورد استفاده برای مقابله با گسترش کویید-19، هنوز به تدابیر بیشتری برای رفع پیامدهای ناشی از آن نیاز است. در این پژوهش برای تشخیص فرد مبتلا به کووید-19 از ویژگیهای بالینی افراد به عنوان دادههای ورودی استفاده شده است که حاصل جمعآوری اطلاعات از پژوهشهای مشابه است. همچنین از الگوریتمهای مختلفی شامل یادگیری ماشین بردار پشتیبان، رگرسیون لجستیک، k نزدیکترین همسایه (k=9)، بیز ساده، جنگل تصادفی، lightgbm، xgboost و catboost استفاده شده که از میان آنها الگوریتمcatboost ، با کسب حساسیت 97/97 درصد، دقت 97/72 درصد و صحت 96/96 درصد بهترین نتایج را از خود نشان داد. در این الگوریتم، برای تنظیم هر چه دقیقتر فوقپارامترها به منظور رسیدن به نتایج مطلوب از روش آزمون و خطا استفاده شده و از shap برای تفسیر نتایج و مشخص کردن تاثیر ویژگیها بر خروجی الگوریتم استفاده گردیده است.
|
کلیدواژه
|
الگوریتم catboost، ویروس کرونا، شبکه عصبی عمیق، بیماری کووید-19، یادگیری ماشین، shap
|
آدرس
|
دانشگاه سمنان, دانشکده مهندسی برق و کامپیوتر, ایران, دانشگاه سمنان, دانشکده مهندسی برق و کامپیوتر, ایران, دانشگاه صنعتی امیرکبیر, دانشکده مهندسی کامپیوتر, ایران
|
پست الکترونیکی
|
h.nasiri@aut.ac.ir
|
|
|
|
|
|
|
|
|
a novel approach based on catboost and explainable artificial intelligence for diagnosis of covid-19 cases using patients’ symptoms
|
|
|
Authors
|
emami samaneh ,seyyedmomeni ali ,nasiri hamid
|
Abstract
|
the covid-19 virus, which was discovered in december 2019 in the city of wuhan, china and quickly spread throughout the world, continues to be an important threat to the health of the world. despite all the strategies used to deal with the spread of covid-19, more contrivances are still needed to deal with its consequences. in this research, the clinical characteristics of people have been used as input data to diagnose a person with covid-19, which is the result of collecting information from similar studies. also, various algorithms including support vector machine, logistic regression, k nearest neighbor (k=9), simple bayes, random forest, lightgbm, xgboost and catboost have been used, among which the catboost algorithm, with a sensitivity of 97.97%, accuracy 97.72% and 96.96% accuracy showed the best results. in this algorithm, the trial and error method has been used to adjust hyperparameters as accurately as possible to achieve the desired results, and shap is used to interpret the results and determine the impact of features on the output.
|
Keywords
|
catboost algorithm ,corona virus ,deep neural network ,covid-19 disease ,machine learning ,shap
|
|
|
|
|
|
|
|
|
|
|