|
|
ارائه یک مدل جدید از فاصله بین کلمات پرس و جو براساس حداقل جابجایی
|
|
|
|
|
نویسنده
|
پاک سیما جواد ,زارع بیدکی علیمحمد ,درهمی ولی
|
منبع
|
رايانش نرم و فناوري اطلاعات - 1396 - دوره : 6 - شماره : 2 - صفحه:1 -12
|
چکیده
|
براساس تحقیقات انجام شده روی موتورهای جستجو، اکثر پرسوجوهای کاربران بیش از یک کلمه میباشد. برای پرسوجوها با بیش از یک کلمه دو مدل میتوان ارائه کرد. در مدل اول فرض میشود کلمات پرسوجو مستقل از یکدیگر هستند و در مدل دوم محل و ترتیب کلمات وابسته فرض میشود. آزمایشها نشان میدهد که در اکثر پرسوجوها بین کلمات وابستگی وجود دارد. یکی از پارامترهایی که میتواند وابستگی بین کلمات پرسوجو را مشخص کند فاصلهی بین کلمات پرسوجو در سند است. در این مقاله تعریف جدیدی از فاصله براساس حداقل جابجایی کلمات سند بهمنظور تطبیق بر پرسوجو ارائه میگردد. همچنین با توجه به اینکه اکثر الگوریتمهای رتبهبندی از فرکانس رخداد یک کلمه در سند (term frequency) برای امتیازدهی به اسناد استفاده میکنند و برای پرسوجو با بیش از یک کلمه تعریف روشنی از این پارامتر وجود ندارد؛ در این مقاله پارامترهای فرکانس رخداد یک عبارت (phrase frequency) و معکوس فرکانس سند (inverted document frequency) با توجه به مفهوم جدید فاصله تعریف شده است و الگوریتمهایی برای محاسبه آنها ارائه گردیده است. همچنین نتایج الگوریتم پیشنهادی با الگوریتم پیادهسازی شده توسط نمایهساز متنباز لوسین مقایسه شده است که افزایش خوبی را در میانگین دقت نشان میدهد.
|
کلیدواژه
|
موتور جستجو، رتبهبندی، فاصله، وابستگی کلمات
|
آدرس
|
دانشگاه پیام نور, گروه کامپیوتر و فناوری اطلاعات, ایران, دانشگاه یزد, دانشکده مهندسی برق و کامپیوتر, ایران, دانشگاه یزد, دانشکده مهندسی برق و کامپیوتر, ایران
|
پست الکترونیکی
|
vderhami@yazd.ac.ir
|
|
|
|
|
|
|
|
|
Providing a new model for the distance between query words based on the minimal displacement
|
|
|
Authors
|
Paksima Javad ,Zare Bidoki Alimohammad ,Derhami Vali
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|