|
|
الگوریتم ترکیبیِ وفقی جهت رتبهبندی صفحات وب با استفاده از ویژگیهای ریزدانه و درشتدانه
|
|
|
|
|
نویسنده
|
زارع بیدکی علی محمد ,آزادنیا محمد ,یزدانی ناصر ,کیهانی پور امیرحسین
|
منبع
|
international journal of information and communication technology research - 2009 - دوره : 1 - شماره : 4 - صفحه:59 -70
|
چکیده
|
حجم عظیم و پویا بودن اطلاعات وب، یکی از مهمترین چالش های بازیابی اطلاعات در پاسخ به پرسش کاربر می باشد. برای بهبود نتایج جستجو تاکنون الگوریتمهای متنوعی مانندbm25 و pagerank ارایه شدهاند. در این مقاله یک الگوریتم رتبه بندی وفقیِ ترکیبی برای دستیابی به دقت و کارایی بالاتر ارایه شده است. این الگوریتم با استفاده از ترکیب الگوریتمهای رتبهبندی موجود به عنوان ویژگی درشتدانه مانند bm25 و tf-idf و همچنین ترکیب ویژگیهای ریزدانهی موجود مانند مانند تکرار واژهها و درجه ورودی صفحات به کمک فرآیند یادگیری به کارآیی بهتری دست یافته است. در فرآیند یادگیری از عملگر تجمیع owa و نظر افراد خبره در مورد درجه ارتباط پرسش و سند استفاده می شود. برای ارزیابی الگوریتم پیشنهادی از مجموعه دادههای محک letor شامل دادههای web trec 2004 استفاده گردید. آزمایشات، افزایش چشمگیری را در میزان دقت بازیابی نشان میدهند.
|
کلیدواژه
|
الگوریتمهای رتبه بندی وب ,رتبه بندی ترکیبی ,دقت ,عملگرتجمیع OWA
|
آدرس
|
دانشگاه یزد, دانشگاه یزد دانشکده مهندسی برق و کامپیوتر, ایران, مرکز تحقیقات مخابرات ایران پژوهشکده فناوری اطلاعات, مرکز تحقیقات مخابرات ایران پژوهشکده فناوری اطلاعات, ایران, دانشگاه تهران, دانشگاه تهران دانشکده مهندسی برق و کامپیوتر, ایران, دانشگاه تهران, دانشگاه تهران دانشکده مهندسی برق و کامپیوتر, ایران
|
پست الکترونیکی
|
keyhanipour@ut.ac.ir
|
|
|
|
|
|
|
|
|
|
|
|
Authors
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|