مدل جدیدی برای جستجوی عبارت بر اساس کمینه جابهجایی وزندار
|
|
|
|
|
نویسنده
|
پاک سیما جواد
|
منبع
|
پردازش علائم و داده ها - 1397 - شماره : 4 - صفحه:71 -84
|
چکیده
|
بر اساس پژوهش های انجام شده روی موتورهای جستجو، بیش تر پرس وجوهای کاربران بیش از یک واژه است. برای پرس وجوهای با بیش از یک واژه دو مدل می توان ارائه داد. در مدل نخست فرض می شود واژگان پرس وجو مستقل از یکدیگر هستند و در مدل دوم محل و ترتیب واژگان وابسته فرض می شود. آزمایش ها نشان می دهد که در بیش تر پرس وجوها بین واژگان وابستگی وجود دارد. یکی از پارامترهایی که می تواند وابستگی بین واژگان پرس وجو را مشخص کند، فاصلۀ بین واژگان پرس وجو در سند است. در این مقاله تعریف جدیدی از فاصله بر اساس کمینه جابه جایی وزن دار واژگان سند به منظور تطبیق بر پرس وجو ارائه می شود. هم چنین با توجه به این که بیش تر الگوریتم های رتبه بندی از فرکانس رخداد یک واژه در سند برای امتیاز دهی به اسناد استفاده می کنند و برای پرس وجو با بیش از یک واژه تعریف روشنی از این پارامتر وجود ندارد. در این مقاله پارامترهای فرکانس رخداد یک عبارت و معکوس فرکانس سند با توجه به مفهوم جدید فاصله تعریف شده و الگوریتم هایی برای محاسبه آن ها ارائه شده است. همچنین نتایج الگوریتم پیشنهادی با چند الگوریتم مقایسه شده است که افزایش خوبی را در میانگین دقّت نشان می دهد.
|
کلیدواژه
|
موتور جستجو، رتبهبندی، فاصله، وابستگی واژگان، فرکانس عبارت (pf)
|
آدرس
|
دانشگاه پیامنور, دانشکده مهندسی کامپیوتر, ایران
|
پست الکترونیکی
|
paksima@pnu.ac.ir
|
|
|
|
|