|
|
روشی سریع تر برای تشخیص گزارش خطای تکثیر با حفظ صحت
|
|
|
|
|
نویسنده
|
امینالرعایائی زهرا ,سلیمانینیسیانی بهزاد ,ندیمیشهرکی محمدحسین
|
منبع
|
علوم رايانش و فناوري اطلاعات - 1397 - دوره : 16 - شماره : 2 - صفحه:49 -66
|
چکیده
|
امروزه یکی از مهمترین چالشهای سیستمهای ردیابی گزارشهای خطای کاربران، تشخیص گزارشهای خطای تکراری است. بسیاری از محققان از روشها و ابزارهای بازیابی اطلاعات برای حل این مشکل استفاده کردهاند که در این پژوهش نیز از آنها با معرفی چندین ویژگی استخراج شده جدید مبتنی بر کمینه و بیشینه و میانگین تعداد تکرار کلمات مشابه در دو گزارش بهره گرفته شده است. ابتدا با در نظر گرفتن مجموعه دادههایی از 4 مخزن بزرگ گزارش خطای android mozilla, openoffice, و eclipse تعداد 162 ویژگی جدید با ترکیب ویژگیهای موجود در کارهای گذشته بهدست آمده است. سپس بسیاری از این ویژگیها، به دلیل اهمیت ناچیز و طولانی کردن زمان اجرای الگوریتمهای طبقهبندی، با اعمال روشهای کاهش بعد حذف شدهاند. نتایج پیادهسازی نشان میدهد که زمان اجرای الگوریتمهای طبقهبندی با ویژگیهای کاهش یافته نسبت به زمان اجرای تمام ویژگیها، از میزان چندین دقیقه به چندین ثانیه کاهش یافته است و در عین حال نیز باعث بهبود تشخیص گزارش خطای تکراری بین %1 الی %6 شده است. همچنین نتایج به دلیل وجود ویژگیهای جدید، بیانگر دقت بالای 96% و نرخ فراخوانی بالای 90/ 0 نسبت به دیگر تحقیقات پیشین شده است.
|
کلیدواژه
|
استخراج ویژگی، تشخیص گزارش خطای تکثیر، الگوریتمهای طبقهبندی، دقت، زمان اجرا
|
آدرس
|
موسسه آموزش عالی علامه نائینی, ایران, دانشگاه کاشان, دانشکده مهندسی برق و کامپیوتر, ایران, دانشگاه آزاد اسلامی واحد نجفآباد, دانشکده مهندسی کامپیوتر, ایران
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Authors
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|