روشی سریع تر برای تشخیص گزارش خطای تکثیر با حفظ صحت

Fa | Ar | En

روشی سریع تر برای تشخیص گزارش خطای تکثیر با حفظ صحت


نویسنده	امین‌الرعایائی زهرا ,سلیمانی‌نیسیانی بهزاد ,ندیمی‌شهرکی محمدحسین
منبع	علوم رايانش و فناوري اطلاعات - 1397 - دوره : 16 - شماره : 2 - صفحه:49 -66
چکیده	امروزه یکی از مهم‌ترین چالش‌های سیستم‌های ردیابی گزارش‌های خطای کاربران، تشخیص گزارش‌های خطای تکراری است. بسیاری از محققان از روش‌ها و ابزارهای بازیابی اطلاعات برای حل این مشکل استفاده کرده‌اند که در این پژوهش نیز از آن‌ها با معرفی چندین ویژگی استخراج‌ شده جدید مبتنی بر کمینه و بیشینه و میانگین تعداد تکرار کلمات مشابه در دو گزارش بهره گرفته‌ شده است. ابتدا با در نظر گرفتن مجموعه داد‌ه‌هایی از 4 مخزن بزرگ گزارش خطای android mozilla, openoffice, و eclipse تعداد 162 ویژگی‌ جدید با ترکیب ویژگی‌های موجود در کارهای گذشته به‌دست ‌آمده است. سپس بسیاری از این ویژگی‌ها، به دلیل اهمیت ناچیز و طولانی کردن زمان اجرای الگوریتم‌های طبقه‌بندی، با اعمال روش‌های کاهش بعد حذف شده‌اند. نتایج پیاده‌سازی نشان می‌دهد که زمان اجرای الگوریتم‌های طبقه‌بندی با ویژگی‌های کاهش یافته نسبت به زمان اجرای تمام ویژگی‌ها، از میزان چندین دقیقه به چندین ثانیه کاهش یافته است و در عین حال نیز باعث بهبود تشخیص گزارش خطای تکراری بین %1 الی %6 شده است. همچنین نتایج به دلیل وجود ویژگی‌های جدید، بیانگر دقت بالای 96% و نرخ فراخوانی بالای 90/ 0 نسبت به دیگر تحقیقات پیشین شده است.
کلیدواژه	استخراج ویژگی، تشخیص گزارش خطای تکثیر، الگوریتم‌های طبقه‌بندی، دقت، زمان اجرا
آدرس	موسسه آموزش عالی علامه نائینی, ایران, دانشگاه کاشان, دانشکده مهندسی برق و کامپیوتر, ایران, دانشگاه آزاد اسلامی واحد نجف‌آباد, دانشکده مهندسی کامپیوتر, ایران



Authors