|
|
توزیع موثر اسناد برای ایجاد توازن بار بین سرورها با استفاده از شمارش رخداد کلمات در سابقه پرسوجوها
|
|
|
|
|
نویسنده
|
تراب جهرمی ریحانه ,ظریف زاده سجاد
|
منبع
|
مهندسي برق و مهندسي كامپيوتر ايران - 1398 - دوره : 17 - شماره : 3 - صفحه:199 -208
|
چکیده
|
هدف اصلی موتورهای جستجو، یافتن مرتبطترین نتایج نسبت به پرسوجوی کاربر در سریعترین زمان ممکن است. صفحات خزششده توسط موتور جستجو بین سرورهای متعددی توزیع میشوند تا در هنگام جستجو بتوان از قدرت بازیابی و پردازش موازی آنها برای تولید سریعتر پاسخ استفاده نمود. با توجه به تعداد بسیار زیاد صفحات وب، موتورهای جستجو سیاستهای مختلفی را برای توزیع مناسب اسناد بین سرورها انتخاب میکنند. در این مقاله، روش جدیدی برای توزیع اسناد پیشنهاد میشود که هدف آن ایجاد توازن بار کاری بین سرورها برای کاهش زمان پاسخگویی موتور جستجو میباشد. ایده اصلی، استفاده از پرسوجوهای قبلی کاربران است بدین ترتیب که به هر کلمه از کلمات موجود در سابقه پرسوجو بر حسب تعداد رخداد روزانه آن، وزنی نسبت داده میشود. سپس هر سند با توجه به مجموع وزن کلمات داخل آن، وزندهی میشود که این وزن ارتباط مستقیمی با احتمال انتخاب آن سند به عنوان پاسخ یک پرسوجو دارد. در نهایت، اسناد به نحوی بین سرورها توزیع میشوند که وزن اسناد داخل هر یک از سرورها برابر باشد. نتایج ارزیابی با استفاده از داده واقعی نشان میدهند که روش پیشنهادی قادر است توازن بار سرورها را مخصوصاً در زمان اوج ورود پرسوجوها بیش از 20% نسبت به روشهای گذشته بهبود بخشد.
|
کلیدواژه
|
توازن بار، توزیع سند، سابقه پرسوجو، موتور جستجو
|
آدرس
|
دانشگاه یزد مهندسی کامپیوتر, ایران, دانشگاه یزد مهندسی کامپیوتر, ایران
|
پست الکترونیکی
|
szarifzadeh@yazd.ac.ir
|
|
|
|
|
|
|
|
|
Efficient Document Partitioning for Load Balancing between Servers Using Term Frequency of Past Queries
|
|
|
Authors
|
Torab Reyhaneh ,Zarifzadeh Sajjad
|
Abstract
|
The main goal of web search engines is to find the most relevant results with respect to the user query in a shortest possible time. To do so, the crawled documents have to be partitioned between several servers in order to use their aggregate retrieval and processing power. The search engines use different policies for efficient partitioning of documents. In this paper, we propose a new document partitioning method that intends to balance the load between servers to reduce the response time of queries. The idea is to weigh each term based on its daily frequency in log of past queries. We then assign a weight to each document via summing the weight of its substituent terms. The weight of a document approximates the likelihood of its presence in future search results. Finally, the documents are partitioned between servers in a way that the sum of document weights in each server becomes roughly equal. Our evaluation results show that the proposed method is able to balance the load by about 20% better than former algorithms, especially in the peak of search engine traffic.
|
Keywords
|
|
|
|
|
|
|
|
|
|
|
|