>
Fa   |   Ar   |   En
   ارائه یک مدل جدید از فاصله بین کلمات پرس و جو براساس حداقل جابجایی  
   
نویسنده پاک سیما جواد ,زارع بیدکی علی‌محمد ,درهمی ولی
منبع رايانش نرم و فناوري اطلاعات - 1396 - دوره : 6 - شماره : 2 - صفحه:1 -12
چکیده    براساس تحقیقات انجام شده روی موتورهای جستجو،‌ اکثر پرس‌وجوهای کاربران بیش از یک کلمه می‌باشد. برای پرس‌وجوها با بیش از یک کلمه دو مدل می‌توان ارائه کرد. در مدل اول فرض می‌شود کلمات پرس‌وجو مستقل از یکدیگر هستند و در مدل دوم محل و ترتیب کلمات وابسته فرض می‌شود. آزمایش‌ها نشان می‌دهد که در اکثر پرس‌وجوها بین کلمات وابستگی وجود دارد. یکی از پارامترهایی که می‌تواند وابستگی بین کلمات پرس‌وجو را مشخص کند فاصله‌ی بین کلمات پرس‌وجو در سند است. در این مقاله تعریف جدیدی از فاصله براساس حداقل جابجایی کلمات سند به‌منظور تطبیق بر پرس‌وجو ارائه می‌گردد. همچنین با توجه به این‌که اکثر الگوریتم‌های رتبه‌بندی از فرکانس رخداد یک کلمه در سند (term frequency) برای امتیازدهی به اسناد استفاده می‌کنند و برای پرس‌وجو با بیش از یک کلمه تعریف روشنی از این پارامتر وجود ندارد؛ در این مقاله پارامترهای  ‌فرکانس رخداد یک عبارت (phrase frequency) و معکوس فرکانس سند (inverted document frequency) با توجه به مفهوم جدید فاصله تعریف شده است و الگوریتم‌هایی برای محاسبه آن‌ها ارائه ‌گردیده است. همچنین نتایج الگوریتم پیشنهادی با الگوریتم پیاده‌سازی شده توسط نمایه‌ساز متن‌باز لوسین مقایسه شده است که افزایش خوبی را در میانگین دقت نشان می‌دهد.
کلیدواژه موتور جستجو، رتبه‌بندی، فاصله، وابستگی کلمات
آدرس دانشگاه پیام نور, گروه کامپیوتر و فناوری اطلاعات, ایران, دانشگاه یزد, دانشکده مهندسی برق و کامپیوتر, ایران, دانشگاه یزد, دانشکده مهندسی برق و کامپیوتر, ایران
پست الکترونیکی vderhami@yazd.ac.ir
 
   Providing a new model for the distance between query words based on the minimal displacement  
   
Authors Paksima Javad ,Zare Bidoki Alimohammad ,Derhami Vali
  
 
 

Copyright 2023
Islamic World Science Citation Center
All Rights Reserved