مرکز منطقه ای اطلاع رساني علوم و فناوري - توزيع مؤثر اسناد براي ايجاد توازن بار بين سرورها با استفاده از شمارش رخداد كلمات در سابقه پرس‌ و جوها

شماره ركورد :

1070889

عنوان مقاله :

توزيع مؤثر اسناد براي ايجاد توازن بار بين سرورها با استفاده از شمارش رخداد كلمات در سابقه پرس‌ و جوها

عنوان به زبان ديگر :

Efficient Document Partitioning for Load Balancing between Servers Using Term Frequency of Past Queries

پديد آورندگان :

تراب جهرمي، ريحانه دانشگاه يزد - گروه مهندسي كامپيوتر , ظريف زاده، سجاد دانشگاه يزد - گروه مهندسي كامپيوتر

تعداد صفحه :

از صفحه :

199

تا صفحه :

208

كليدواژه :

توازن بار , توزيع سند , سابقه پرس و جو , موتور جستجو

چكيده فارسي :

هدف اصلي موتورهاي جستجو، يافتن مرتبط‌ترين نتايج نسبت به پرس‌وجوي كاربر در سريع‌ترين زمان ممكن است. صفحات خزش‌شده توسط موتور جستجو بين سرورهاي متعددي توزيع مي‌شوند تا در هنگام جستجو بتوان از قدرت بازيابي و پردازش موازي آنها براي توليد سريع‌تر پاسخ استفاده نمود. با توجه به تعداد بسيار زياد صفحات وب، موتورهاي جستجو سياست‌هاي مختلفي را براي توزيع مناسب اسناد بين سرورها انتخاب مي‌كنند. در اين مقاله، روش جديدي براي توزيع اسناد پيشنهاد مي‌شود كه هدف آن ايجاد توازن بار كاري بين سرورها براي كاهش زمان پاسخ‌گويي موتور جستجو مي‌باشد. ايده اصلي، استفاده از پرس‌وجوهاي قبلي كاربران است بدين ترتيب كه به هر كلمه از كلمات موجود در سابقه پرس‌وجو بر حسب تعداد رخداد روزانه آن، وزني نسبت داده مي‌شود. سپس هر سند با توجه به مجموع وزن كلمات داخل آن، وزن‌دهي مي‌شود كه اين وزن ارتباط مستقيمي با احتمال انتخاب آن سند به عنوان پاسخ يك پرس‌وجو دارد. در نهايت، اسناد به نحوي بين سرورها توزيع مي‌شوند كه وزن اسناد داخل هر يك از سرورها برابر باشد. نتايج ارزيابي با استفاده از داده واقعي نشان مي‌دهند كه روش پيشنهادي قادر است توازن بار سرورها را مخصوصاً در زمان اوج ورود پرس‌وجوها بيش از 20% نسبت به روش‌هاي گذشته بهبود بخشد.

چكيده لاتين :

The main goal of web search engines is to find the most relevant results with respect to the user query in a shortest possible time. To do so, the crawled documents have to be partitioned between several servers in order to use their aggregate retrieval and processing power. The search engines use different policies for efficient partitioning of documents. In this paper, we propose a new document partitioning method that intends to balance the load between servers to reduce the response time of queries. The idea is to weigh each term based on its daily frequency in log of past queries. We then assign a weight to each document via summing the weight of its substituent terms. The weight of a document approximates the likelihood of its presence in future search results. Finally, the documents are partitioned between servers in a way that the sum of document weights in each server becomes roughly equal. Our evaluation results show that the proposed method is able to balance the load by about 20% better than former algorithms, especially in the peak of search engine traffic.

سال انتشار :

1398

عنوان نشريه :

مهندسي برق و مهندسي كامپيوتر ايران

فايل PDF :

7652364

عنوان نشريه :

مهندسي برق و مهندسي كامپيوتر ايران

لينک به اين مدرک :

https://search.ricest.ac.ir/dl/search/defaultta.aspx?DTC=8&DC=1070889