>
Fa   |   Ar   |   En
   اثربخشی بسط پرس‌وجو مبتنی بر خوشه‌بندی اسناد شبه‌بازخورد با الگوریتم knn  
   
نویسنده خدایی رضا ,بالافر محمدعلی ,رضوی ناصر
منبع مهندسي برق دانشگاه تبريز - 1395 - دوره : 46 - شماره : 1 - صفحه:143 -151
چکیده    بسط پرس‌وجو یکی از روش‌های موثر در بهبود اثربخشی نتایج بازیابی اطلاعات است. روش بازخورد شبه‌مرتبط (prf) فرض می‌کند که اسناد رتبه‌بالا از نتایج اولیه بازیابی‌شده مرتبط به پرس‌وجو است و تعدادی کلمه مرتبط را از اسناد رتبه‌بالا برای بسط انتخاب می‌کند. وجود اسناد نامرتبط در بین اسناد رتبه بالا محققان را به ارائه روش‌هایی برای انتخاب بهترین اسناد به‌عنوان منبع برای انتخاب کلمه بسط سوق می‌دهد که انتخاب بهترین اسناد برای استخراج کلمات مرتبط برای بسط، موضوع مهمی در روش‌های بسط پرس‌وجو هست. در این مقاله، از خوشه‌بندی اسناد شبه‌بازخورد (cprf) حاصل از نتایج اولیه، بر اساس شباهت مبتنی بر کلمه برای قرار دادن شبیه‌ترین اسناد کنار هم استفاده می‌شود. تعدادی از خوشه‌ها طبق محتوایشان به‌عنوان خوشه‌های بازخورد انتخاب می‌شوند و از خوشه‌های بازخورد، اسناد رتبه‌بالا به‌عنوان اسناد بازخورد انتخاب می‌شوند. سپس، یک سند ترکیبی از روی اسناد انتخابی تشکیل می‌شود و کلمات سند ترکیبی بر اساس تابع رتبه‌بندی tfidf مرتب می‌شوند. بعد، کلمات رتبه بالا برای بسط انتخاب می‌شوند. آزمایش‌های انجام‌گرفته روی مجموعه داده پزشکی med نشان می‌دهد روش پیشنهادی معیار متوسط میانگین دقت (map) بالاتری نسبت به روش بازخورد شبه‌مرتبط (prf) دارد.
کلیدواژه بازیابی اطلاعات، بسط پرس‌وجو، بازخورد شبه‌مرتبط، کلمات بسط، اسناد بازخورد
آدرس دانشگاه تبریز, دانشکده مهندسی برق و کامپیوتر, ایران, دانشگاه تبریز, دانشکده مهندسی برق و کامپیوتر, ایران, دانشگاه تبریز, دانشکده مهندسی برق و کامپیوتر, ایران
پست الکترونیکی razavi@iust.ac.ir
 
     
   
Authors
  
 
 

Copyright 2023
Islamic World Science Citation Center
All Rights Reserved