|
|
طبقهبندی خودکار bi-rads در گزارشهای ماموگرافی با استفاده از تلفیقداده
|
|
|
|
|
نویسنده
|
ذهابی محمد ,شیری محمد ابراهیم ,حاج سید جوادی حمید ,برومندزاده مصطفی
|
منبع
|
ارمغان دانش - 1403 - دوره : 29 - شماره : 3 - صفحه:365 -385
|
چکیده
|
زمینه و هدف: سرطان پستان یکی از شایعترین سرطانها در زنان و عامل اصلی مرگ و میر در بیماریهای سرطانی است و ماموگرافی روش تصویربرداری اولیه برای تشخیص زودهنگام تودههای پستان است. تشخیص سریع با دقت بالا یکی از دغدغههای جدی پزشکان و مراکز بهداشتی درمانی در مواجهه با بیماریهای خاص است، لذا هدف از این مقاله تعیین و طبقهبندی خودکار bi-rads در گزارشهای ماموگرافی با استفاده از تلفیق داده بود. روش بررسی: این یک مطالعه توصیفی تحلیلی و گذشته نگر میباشد که در سال 1402 انجام شد، گزارش ماموگرافی و پرونده الکترونیکی بیمار که به ترتیب از سیستم بایگانی و ارتباط تصویر و سوابق بیمار استخراج شدند، از اطلاعات موجود در مرکز آموزشی درمانی بیمارستان شهیدزاده شهرستان بهبهان به دست آمده است که شامل گزارش ماموگرافی و پرونده الکترونیکی 250 بیمار است که اطلاعات کامل داشتند. برای مدلسازی روش پیشنهادی با استفاده از دادههای جمع آوری شده، از نرم افزار پایتون در محیط ویژوال استودیو کد استفاده شده است. در نهایت از صحتسنجیمتقاطع برای ارزیابی کیفیت و اعتبار نتایج استفاده شد.یافتهها: نتایج نشان داد رویکرد پیشنهادی یعنی استفاده از تکنیک تبدیل کلمه به بردار به همراه روش فراوانی وزنی کلمات کلیدی و تلفیق آنها با his تاثیر قابل توجهی بر دقت طبقهبندی متون پزشکی دارد. برای طبقهبندی سطح سیستم گزارش و داده تصویربرداری پستان (bi-rads) از بردارهای خروجی تکنیک تبدیل کلمه به بردار در زمانی که از روش فراوانی وزنی کلمات کلیدی استفاده میشود و یا بدون استفاده از روش فراوانی وزنی کلمات کلیدی و همچنین با تلفیق his و نیز بدون his برای طبقهبندی کنندههای شبکه عصبی پیچشی، پرسپترون چندلایه، درخت تصمیم و k نزدیکترین همسایه استفاده شد و نتایج به وسیله معیارهای ارزیابی دقت، ویژگی، حساسیت، ارزش پیشبینی شده مثبت، ارزش پیشبینی شده منفی و امتیاز f1 با هم مقایسه شدند. نتایج نشان میدهد که بهترین دقت در روش پیشنهادی با طبقهبندی کننده پرسپترون چندلایه برابر با 98.74 درصد میباشد، اما بدون his دقت همین طبقهبندی کننده برابر با 92.23 درصد به دست آمد.نتیجهگیری: ترکیب تکنیک تبدیل کلمه به بردار با روش فراوانی وزنی کلمات کلیدی میتواند دقت طبقهبندی متن را افزایش دهد، اما سابقه پزشکی که در تشخیص بیماری مهم است، میتواند دقت را بهبود ببخشد. نتایج نشان میدهد نباید صرفاً بر روی بررسیهای پزشکی تمرکز کرد و از سایر اطلاعات بالینی و سابقه بیماران نیز باید استفاده کرد. بنابراین استفاده از his در کنار گزارشهای پزشکی میتواند طبقهبندی سیستم گزارش و داده تصویربرداری پستان را بهبود ببخشد و تاثیر مثبتی بر تشخیص و فرآیندهای درمانی داشته باشد.
|
کلیدواژه
|
طبقهبندی متون پزشکی، سرطان پستان، استخراج ویژگی، سیستم گزارش و داده تصویربرداری پستان، سیستم اطلاعات بیمارستان
|
آدرس
|
دانشگاه آزاد اسلامی واحد بروجرد, گروه مهندسی کامپیوتر, ایران, دانشگاه صنعتی امیرکبیر, گروه ریاضی و علوم کامپیوتر, ایران, دانشگاه شاهد, گروه ریاضی و علوم کامپیوتر, ایران, دانشگاه پیام نور مرکز تهران, گروه مهندسی کامپیوتر و فناوری اطلاعات, ایران
|
پست الکترونیکی
|
m.boroumandzadeh@pnu.ac.ir
|
|
|
|
|
|
|
|
|
automatic classification of bi-rads in mammography reports using data fusion
|
|
|
Authors
|
zahabi m ,shiri me ,haj seyed javadi h ,broumandzadeh m
|
Abstract
|
background & aim: breast cancer is one of the most common cancers in women and the main cause of death in cancer diseases, and mammography is the primary imaging method for early detection of breast masses. rapid diagnosis with high accuracy is one of the serious concerns of doctors and healthcare centers when facing certain diseases, so the purpose of this article was to determine the automatic classification of bi-rads in mammography reports using data fusion.methods: the present descriptive, analytical, and retrospective study was conducted in 2023, the mammography report and the electronic file of the patients were extracted from the archiving and communication system of the patient’s image and records obtained from the available information in the medical training center of shahidzadeh hospital in behbahan, iran, which includes the mammography reports and the electronic record of 250 patients who had ample information. to model the proposed method using the collected dataset, python software was used in the visual studio code environment. finally, cross-validation was used to evaluate the quality and validity of the results.results: the results confirmed that the proposed approach, namely the use of word2vec combined with tfidf, and their integration with his, had a significant impact on the accuracy of medical text classification. the output vectors of word2vec were used for bi-rads level classification when tfidf was applied or not applied, as well as with and without the integration of his, for classifiers such as cnn, mlp, dt, and k-nn, and the results were compared using evaluation measures such as accuracy, precision, sensitivity, positive predictive value, negative predictive value, and f1 score. the results indicated that the best accuracy with the proposed method using the multilayer perceptron classifier was 98.74%, but without his, the accuracy for the same classifier was 92.23%.conclusion: by combining word2vec with tfidf, the accuracy of text classification could be increased, but the medical history of patients was important in the diagnosis of disease and could improve the accuracy. the results indicated that one should not focus only on medical reports and other clinical information and patients’ history should also be used. therefore, the use of his along with medical text reports could improve bi-rads classification and have a positive effect on diagnosis and treatment processes.
|
Keywords
|
medical text classification ,breast cancer ,feature extraction ,bi-rads ,his
|
|
|
|
|
|
|
|
|
|
|