>
Fa   |   Ar   |   En
   طبقه‌بندی خودکار bi-rads در گزارش‌های ماموگرافی با استفاده از تلفیق‌داده  
   
نویسنده ذهابی محمد ,شیری محمد ابراهیم ,حاج سید جوادی حمید ,برومندزاده مصطفی
منبع ارمغان دانش - 1403 - دوره : 29 - شماره : 3 - صفحه:365 -385
چکیده    زمینه و هدف: سرطان پستان یکی از شایع‌ترین سرطان‌ها در زنان و عامل اصلی مرگ و میر در بیماری‌های سرطانی است و ماموگرافی روش تصویربرداری اولیه برای تشخیص زودهنگام توده‌های پستان است. تشخیص سریع با دقت بالا یکی از دغدغه‌های جدی پزشکان و مراکز بهداشتی درمانی در مواجهه با بیماری‌های خاص است، لذا هدف از این مقاله تعیین و طبقه‌بندی خودکار bi-rads در گزارش‌های ماموگرافی با استفاده از تلفیق داده بود. روش بررسی: این یک مطالعه توصیفی تحلیلی و گذشته نگر می‌باشد که در سال 1402 انجام شد، گزارش ماموگرافی و پرونده الکترونیکی بیمار که به ترتیب از سیستم بایگانی و ارتباط تصویر و سوابق بیمار استخراج شدند، از اطلاعات موجود در مرکز آموزشی درمانی بیمارستان شهیدزاده شهرستان بهبهان به دست آمده است که شامل گزارش ماموگرافی و پرونده الکترونیکی 250 بیمار است که اطلاعات کامل داشتند. برای مدل‌سازی روش پیشنهادی با استفاده از داده‌های جمع آوری شده، از نرم افزار پایتون در محیط ویژوال استودیو کد استفاده شده است. در نهایت از صحت‌سنجی‌متقاطع برای ارزیابی کیفیت و اعتبار نتایج استفاده شد.یافته‌ها: نتایج  نشان داد رویکرد پیشنهادی یعنی استفاده از تکنیک تبدیل کلمه به بردار به همراه روش فراوانی وزنی کلمات کلیدی و تلفیق آن‌ها با his تاثیر قابل‌ توجهی بر دقت طبقه‌بندی متون پزشکی دارد. برای طبقه‌بندی سطح سیستم گزارش و داده تصویربرداری پستان  (bi-rads) از بردارهای خروجی تکنیک تبدیل کلمه به بردار در زمانی که از روش فراوانی وزنی کلمات کلیدی استفاده می‌شود و یا بدون استفاده از روش فراوانی وزنی کلمات کلیدی و هم‌چنین با تلفیق his و نیز بدون his برای طبقه‌بندی‌ کننده‌های شبکه عصبی پیچشی، پرسپترون چندلایه، درخت تصمیم و k نزدیک‌ترین همسایه استفاده شد و نتایج به وسیله معیارهای ارزیابی دقت، ویژگی، حساسیت، ارزش پیش‌بینی شده مثبت، ارزش پیش‌بینی شده منفی و امتیاز f1 با هم مقایسه شدند. نتایج نشان می‌دهد که بهترین دقت در روش پیشنهادی با طبقه‌بندی ‌کننده پرسپترون چندلایه برابر با 98.74 درصد می‌باشد، اما بدون his دقت همین طبقه‌بندی‌ کننده برابر با 92.23 درصد به دست آمد.نتیجه‌گیری: ترکیب تکنیک تبدیل کلمه به بردار با روش فراوانی وزنی کلمات کلیدی می‌تواند دقت طبقه‌بندی متن را افزایش دهد، اما سابقه پزشکی که در تشخیص بیماری مهم است، می‌تواند دقت را بهبود ببخشد. نتایج نشان می‌دهد نباید صرفاً بر روی بررسی‌های پزشکی تمرکز کرد و از سایر اطلاعات بالینی و سابقه بیماران نیز باید استفاده کرد. بنابراین استفاده از his در کنار گزارش‌های پزشکی می‌تواند طبقه‌بندی سیستم گزارش و داده تصویربرداری پستان را بهبود ببخشد و تاثیر مثبتی بر تشخیص و فرآیندهای درمانی داشته باشد. 
کلیدواژه طبقه‌بندی متون پزشکی، سرطان پستان، استخراج ویژگی، سیستم گزارش و داده تصویربرداری پستان، سیستم اطلاعات بیمارستان
آدرس دانشگاه آزاد اسلامی واحد بروجرد, گروه مهندسی کامپیوتر, ایران, دانشگاه صنعتی امیرکبیر, گروه ریاضی و علوم کامپیوتر, ایران, دانشگاه شاهد, گروه ریاضی و علوم کامپیوتر, ایران, دانشگاه پیام نور مرکز تهران, گروه مهندسی کامپیوتر و فناوری اطلاعات, ایران
پست الکترونیکی m.boroumandzadeh@pnu.ac.ir
 
   automatic classification of bi-rads in mammography reports using data fusion  
   
Authors zahabi m ,shiri me ,haj seyed javadi h ,broumandzadeh m
Abstract    background & aim: breast cancer is one of the most common cancers in women and the main cause of death in cancer diseases, and mammography is the primary imaging method for early detection of breast masses. rapid diagnosis with high accuracy is one of the serious concerns of doctors and healthcare centers when facing certain diseases, so the purpose of this article was to determine the automatic classification of bi-rads in mammography reports using data fusion.methods: the present descriptive, analytical, and retrospective study was conducted in 2023, the mammography report and the electronic file of the patients were extracted from the archiving and communication system of the patient’s image and records obtained from the available information in the medical training center of shahidzadeh hospital in behbahan, iran, which includes the mammography reports and the electronic record of 250 patients who had ample information. to model the proposed method using the collected dataset, python software was used in the visual studio code environment. finally, cross-validation was used to evaluate the quality and validity of the results.results: the results confirmed that the proposed approach, namely the use of word2vec combined with tfidf, and their integration with his, had a significant impact on the accuracy of medical text classification. the output vectors of word2vec were used for bi-rads level classification when tfidf was applied or not applied, as well as with and without the integration of his, for classifiers such as cnn, mlp, dt, and k-nn, and the results were compared using evaluation measures such as accuracy, precision, sensitivity, positive predictive value, negative predictive value, and f1 score. the results indicated that the best accuracy with the proposed method using the multilayer perceptron classifier was 98.74%, but without his, the accuracy for the same classifier was 92.23%.conclusion: by combining word2vec with tfidf, the accuracy of text classification could be increased, but the medical history of patients was important in the diagnosis of disease and could improve the accuracy. the results indicated that one should not focus only on medical reports and other clinical information and patients’ history should also be used. therefore, the use of his along with medical text reports could improve bi-rads classification and have a positive effect on diagnosis and treatment processes. 
Keywords medical text classification ,breast cancer ,feature extraction ,bi-rads ,his
 
 

Copyright 2023
Islamic World Science Citation Center
All Rights Reserved