|
|
افزایش سرعت جستجو در مدلهای مبتنی بر مجاورت
|
|
|
|
|
نویسنده
|
پاکسیما جواد ,زارع بیدکی علیمحمد ,درهمی ولی
|
منبع
|
مهندسي برق و مهندسي كامپيوتر ايران - 1396 - دوره : 15 - شماره : 2 - صفحه:153 -158
|
چکیده
|
یکی از اصلیترین چالشهای مدلهای مبتنی بر مجاورت مساله سرعت بازیابی اطلاعات میباشد. در مدلهای مبتنی بر مجاورت مفهومی به نام فاصله تعریف میشود که برای محاسبه آن باید موقعیت کلمات پرس و جو در سند استخراج شود. این موضوع یعنی استخراج موقعیتها و محاسبه فاصلهها فرایندی زمانبر است و چون غالباً در زمان جستجو اجرا میشود از دید کاربر اهمیت بیشتری دارد. در صورتی که بتوان تعداد اسناد مورد بررسی را کاهش داد بازیابی سریعتر میشود. در این مقاله الگوریتمی به نام 3sntk برای هرسکردن پویای اسناد در موقع جستجوی عبارت ارائه گردیده است. برای اجتناب از تخصیص بیش از حد حافظه و کاهش ریسک بروز خطا در موقع بازیابی، امتیاز تعدادی از اسناد بدون هیچ گونه هرسی محاسبه میشود (skip-n). در این الگوریتم از سه هرم حداقل برای استخراج اسناد دارای بالاترین امتیازها استفاده شده و آزمایشها نشان میدهد که استفاده از الگوریتم پیشنهادی باعث بهبود سرعت بازیابی میگردد.
|
کلیدواژه
|
موتور جستجو، رتبهبندی، فاصله، مدل مجاورت، سرعت بازیابی
|
آدرس
|
دانشگاه یزد, دانشکده برق و کامپیوتر, ایران, دانشگاه یزد, دانشکده برق و کامپیوتر, ایران, دانشگاه یزد, دانشکده برق و کامپیوتر, ایران
|
پست الکترونیکی
|
vderhami@yazd.ac.ir
|
|
|
|
|
|
|
|
|
Speed up the Search for ProximityBased Models
|
|
|
Authors
|
Paksima J. ,Zareh A. ,Derhami V.
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|