>
Fa   |   Ar   |   En
   یادگیری رتبه ‏بندی محتوای فارسی وب بر مبنای برنامه‏ نویسی ژنتیک چند لایه  
   
نویسنده کیهانی پور امیرحسین
منبع فناوري اطلاعات و ارتباطات ايران - 1397 - دوره : 10 - شماره : 37-38 - صفحه:45 -70
چکیده    یادگیری رتبه‏بندی، یک رویکرد نو ظهور به منظور رفع چالش‏های موجود و بهبود عملکرد جویشگرهای وب، بسیار امید بخش و کارآمد است. در عین حال عدم توجه جدی به سوابق تعاملات کاربران با جویشگر طی فرآیند جستجو و ارزیابی نتایج بدست آمده، یکی از معضلات جدی آن بشمار می‏رود. در عین حال حجم بسیار زیاد ویژگی‏های مورد نیاز از اسناد و پرس‏وجوهای کاربران نیز کاربردی بودن این رویکرد را در شرایط واقعی با ابهام مواجه ساخته است. استفاده از مدل اطلاعات کلیک از گذر داده‏ها و تولید ویژگی‏های کلیک از گذر داده، راهکار نوینی است که بر مبنای آن و با بکارگیری مدل برنامه‏نویسی ژنتیک چند لایه، مدل رتبه‏بندی مناسبی تحت عنوان mgprank برای بازیابی اطلاعات انگلیسی وب، عرضه شده است. در این پژوهش این، با عنایت به ویژگی‏های خاص زبان فارسی، از طریق ارائه سناریوهای مناسب برای ایجاد ویژگی‏های کلیک از گذر داده این الگوریتم، این الگوریتم بومی‏سازی شده است. نتایج حاصل از ارزیابی عملکرد این الگوریتم در حوزه زبان فارسی با استفاده از مجموعه داده dotir، حاکی از توانمندی قابل ملاحظه آن نسبت به روش‏های مرجع رتبه‏بندی اطلاعات است. این بهبود عملکرد، بخصوص در بخش ابتدایی فهرست نتایج جستجو که غالباً بیشتر مورد مراجعه کاربران است، قابل توجه است.
کلیدواژه یادگیری رتبه بندی، مدل برنامه نویسی ژنتیک چند لایه، ویژگی های کلیک از گذر داده، محتوای فارسی وب، مجموعه داده dotir
آدرس دانشگاه تهران، پردیس فارابی, دانشکده مهندسی, گروه مهندسی کامپیوتر, ایران
پست الکترونیکی keyhanipour@ut.ac.ir
 
   Learning to Rank for the Persian Web Using the Layered Genetic Programming  
   
Authors Keyhanipour Amir Hosein
  
 
 

Copyright 2023
Islamic World Science Citation Center
All Rights Reserved