افزایش سرعت جستجو در مدل‌‌های مبتنی بر مجاورت

Fa | Ar | En

افزایش سرعت جستجو در مدل‌‌های مبتنی بر مجاورت


نویسنده	پاک‌سیما جواد ,زارع بیدکی علی‌محمد ,درهمی ولی
منبع	مهندسي برق و مهندسي كامپيوتر ايران - 1396 - دوره : 15 - شماره : 2 - صفحه:153 -158
چکیده	یکی از اصلی‌‌ترین چالش‌‌های مدل‌‌های مبتنی بر مجاورت مساله سرعت بازیابی اطلاعات می‌‌باشد. در مدل‌‌های مبتنی بر مجاورت مفهومی به نام فاصله تعریف می‌‌شود که برای محاسبه آن باید موقعیت کلمات پرس و جو در سند استخراج شود. این موضوع یعنی استخراج موقعیت‌‌ها و محاسبه فاصله‌‌ها فرایندی زمان‌‌بر است و چون غالباً در زمان جستجو اجرا می‌‌شود از دید کاربر اهمیت بیشتری دارد. در صورتی که بتوان تعداد اسناد مورد بررسی را کاهش داد بازیابی سریع‌‌تر می‌‌شود. در این مقاله الگوریتمی به نام 3sntk برای هرس‌کردن پویای اسناد در موقع جستجوی عبارت ارائه گردیده است. برای اجتناب از تخصیص بیش از حد حافظه و کاهش ریسک بروز خطا در موقع بازیابی، امتیاز تعدادی از اسناد بدون هیچ گونه هرسی محاسبه می‌‌شود (skip-n). در این الگوریتم از سه هرم حداقل برای استخراج اسناد دارای بالاترین امتیازها استفاده شده و آزمایش‌‌ها نشان می‌‌دهد که استفاده از الگوریتم‌‌ ‌‌پیشنهادی باعث بهبود سرعت بازیابی می‌‌گردد.
کلیدواژه	موتور جستجو، رتبه‌بندی، فاصله، مدل مجاورت، سرعت بازیابی
آدرس	دانشگاه یزد, دانشکده برق و کامپیوتر, ایران, دانشگاه یزد, دانشکده برق و کامپیوتر, ایران, دانشگاه یزد, دانشکده برق و کامپیوتر, ایران
پست الکترونیکی	vderhami@yazd.ac.ir

Speed up the Search for ProximityBased Models

Authors	Paksima J. ,Zareh A. ,Derhami V.