|
|
بسط پرس وجو با خوشه بندی اسناد شبه بازخورد با شباهت حساس به پرس وجو
|
|
|
|
|
نویسنده
|
خدائی رضا ,بالافر محمدعلی ,رضوی ناصر
|
منبع
|
مدل سازي در مهندسي - 1395 - دوره : 14 - شماره : 47 - صفحه:243 -254
|
چکیده
|
بسط پرسوجو بهعنوان یکی از روشهای انطباق پرسوجو، اثربخشی جستجو را در بازیابی اطلاعات افزایش میدهد. بازخورد شبه مرتبط (prf) روشی برای بسط پرسوجو است که فرض میکند اسناد رتبه بالا از نتایج اولیه مرتبط به موضوع پرسوجو هستند و کلمات بسط را از این اسناد انتخاب میکند. درحالیکه ممکن است اسناد نامرتبط به پرسوجو در اسناد رتبهبالا وجود داشته باشد. روشهایی برای انتخاب اسناد مرتبط و نادیده گرفتن اسناد خطا از اسناد رتبهبالا ارائهشده است که از خوشهبندی و یا طبقهبندی اسناد استفاده کردهاند. مهمترین موضوع در بسط پرسوجو، انتخاب کلمات بسط از مرتبطترین اسناد است. در این مقاله ما خوشهبندی اسناد شبه بازخورد را براساس شباهت حساس به پرسوجو ارائه میکنیم که در قرار دادن شبیهترین اسناد در کنار هم موثر است. شباهت حساس به پرسوجو که نسبت به شباهت مبتنی بر کلمه نتایج بهتری را در بازیابی اسناد بدست آورده است، دلیل استفاده در این مقاله است. خوشهها را مطابق با شباهت درونیشان رتبهبندی کرده و تعدادی از خوشههای رتبهبالا را برای بسط انتخاب میکنیم. کلمات بسط را از اسناد خوشههای انتخابشده، براساس تابع رتبهبندی tfidf استخراج میکنیم. آزمایشهای انجامشده روی مجموعهدادهی پزشکی med نشان میدهد که نتایج جستجو برای پرسوجوهای بسطدادهشده با اسناد انتخابشده از خوشهها، نسبت به روش بازخورد شبه مرتبط (prf) و بازیابی اولیه (vsm) بهتر است و اثربخشی جستجو را افزایش میدهد.
|
کلیدواژه
|
بازیابی اطلاعات، بسط پرس وجو، بازخورد شبه مرتبط، شباهت حساس به پرس وجو
|
آدرس
|
دانشگاه تبریز, ایران, دانشگاه تبریز, دانشکده برق و کامپیوتر, ایران, دانشگاه تبریز, دانشکده برق و کامپیوتر, ایران
|
پست الکترونیکی
|
razavi@iust.ac.ir
|
|
|
|
|
|
|
|
|
Query expansion using the clustering of pseudo relevant documents with query sensitive similarity
|
|
|
Authors
|
Khodaei Reza ,Balafar Mohammadali ,Razavi seyed Naser
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|