|
|
اثربخشی بسط پرسوجو مبتنی بر خوشهبندی اسناد شبهبازخورد با الگوریتم knn
|
|
|
|
|
نویسنده
|
خدایی رضا ,بالافر محمدعلی ,رضوی ناصر
|
منبع
|
مهندسي برق دانشگاه تبريز - 1395 - دوره : 46 - شماره : 1 - صفحه:143 -151
|
چکیده
|
بسط پرسوجو یکی از روشهای موثر در بهبود اثربخشی نتایج بازیابی اطلاعات است. روش بازخورد شبهمرتبط (prf) فرض میکند که اسناد رتبهبالا از نتایج اولیه بازیابیشده مرتبط به پرسوجو است و تعدادی کلمه مرتبط را از اسناد رتبهبالا برای بسط انتخاب میکند. وجود اسناد نامرتبط در بین اسناد رتبه بالا محققان را به ارائه روشهایی برای انتخاب بهترین اسناد بهعنوان منبع برای انتخاب کلمه بسط سوق میدهد که انتخاب بهترین اسناد برای استخراج کلمات مرتبط برای بسط، موضوع مهمی در روشهای بسط پرسوجو هست. در این مقاله، از خوشهبندی اسناد شبهبازخورد (cprf) حاصل از نتایج اولیه، بر اساس شباهت مبتنی بر کلمه برای قرار دادن شبیهترین اسناد کنار هم استفاده میشود. تعدادی از خوشهها طبق محتوایشان بهعنوان خوشههای بازخورد انتخاب میشوند و از خوشههای بازخورد، اسناد رتبهبالا بهعنوان اسناد بازخورد انتخاب میشوند. سپس، یک سند ترکیبی از روی اسناد انتخابی تشکیل میشود و کلمات سند ترکیبی بر اساس تابع رتبهبندی tfidf مرتب میشوند. بعد، کلمات رتبه بالا برای بسط انتخاب میشوند. آزمایشهای انجامگرفته روی مجموعه داده پزشکی med نشان میدهد روش پیشنهادی معیار متوسط میانگین دقت (map) بالاتری نسبت به روش بازخورد شبهمرتبط (prf) دارد.
|
کلیدواژه
|
بازیابی اطلاعات، بسط پرسوجو، بازخورد شبهمرتبط، کلمات بسط، اسناد بازخورد
|
آدرس
|
دانشگاه تبریز, دانشکده مهندسی برق و کامپیوتر, ایران, دانشگاه تبریز, دانشکده مهندسی برق و کامپیوتر, ایران, دانشگاه تبریز, دانشکده مهندسی برق و کامپیوتر, ایران
|
پست الکترونیکی
|
razavi@iust.ac.ir
|
|
|
|
|
|
|
|
|
|
|
|
Authors
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|