>
Fa   |   Ar   |   En
   بسط پرس وجو با خوشه بندی اسناد شبه بازخورد با شباهت حساس به پرس وجو  
   
نویسنده خدائی رضا ,بالافر محمدعلی ,رضوی ناصر
منبع مدل سازي در مهندسي - 1395 - دوره : 14 - شماره : 47 - صفحه:243 -254
چکیده    بسط پرس‌وجو به‌عنوان یکی از روش‌های انطباق پرس‌وجو، اثربخشی جستجو را در بازیابی اطلاعات افزایش می‌دهد. بازخورد شبه مرتبط (prf) روشی برای بسط پرس‌وجو است که فرض می‌کند اسناد رتبه بالا از نتایج اولیه مرتبط به موضوع پرس‌وجو هستند و کلمات بسط را از این اسناد انتخاب می‌کند. درحالی‌که ممکن است اسناد نامرتبط به پرس‌وجو در اسناد رتبه‌بالا وجود داشته باشد. روش‌هایی برای انتخاب اسناد مرتبط و نادیده گرفتن اسناد خطا از اسناد رتبه‌بالا ارائه‌شده است که از خوشه‌بندی و یا طبقه‌بندی اسناد استفاده کرده‌اند. مهم‌ترین موضوع در بسط پرس‌وجو، انتخاب کلمات بسط از مرتبطترین اسناد است. در این مقاله ما خوشه‌بندی اسناد شبه بازخورد را براساس شباهت حساس به پرس‌وجو ارائه می‌کنیم که در قرار دادن شبیه‌ترین اسناد در کنار هم موثر است. شباهت حساس به پرس‌وجو که نسبت به شباهت مبتنی بر کلمه نتایج بهتری را در بازیابی اسناد بدست آورده است، دلیل استفاده در این مقاله است. خوشه‌ها را مطابق با شباهت درونی‌شان رتبه‌بندی کرده و تعدادی از خوشه‌های رتبه‌بالا را برای بسط انتخاب می‌کنیم. کلمات بسط را از اسناد خوشه‌های انتخاب‌شده، براساس تابع رتبه‌بندی tfidf استخراج می‌کنیم. آزمایش‌های انجام‌شده روی مجموعه‌داده‌ی پزشکی med نشان می‌دهد که نتایج جستجو برای پرس‌وجوهای بسط‌داده‌شده با اسناد انتخاب‌شده از خوشه‌ها، نسبت به روش بازخورد شبه مرتبط (prf) و بازیابی اولیه (vsm) بهتر است و اثربخشی جستجو را افزایش می‌دهد.
کلیدواژه بازیابی اطلاعات، بسط پرس وجو، بازخورد شبه مرتبط، شباهت حساس به پرس وجو
آدرس دانشگاه تبریز, ایران, دانشگاه تبریز, دانشکده برق و کامپیوتر, ایران, دانشگاه تبریز, دانشکده برق و کامپیوتر, ایران
پست الکترونیکی razavi@iust.ac.ir
 
   Query expansion using the clustering of pseudo relevant documents with query sensitive similarity  
   
Authors Khodaei Reza ,Balafar Mohammadali ,Razavi seyed Naser
  
 
 

Copyright 2023
Islamic World Science Citation Center
All Rights Reserved