>
Fa   |   Ar   |   En
   بازیابی و رتبه‌بندی افراد خبره با استفاده از مدل ترجمه مبتنی‌بر خوشه‌بندی  
   
نویسنده دهقان مهدی ,آبین احمدعلی
منبع مهندسي برق دانشگاه تبريز - 1398 - دوره : 49 - شماره : 3 - صفحه:1095 -1106
چکیده    استخراج دانش از میان داده‌های موجود در وب باتوجه‌‌ ‌به حجم و تنوع بالای آن به یک چالش در حوزه‌ی بازیابی اطلاعات تبدیل شده‌است. در این میان، مساله‌ی بازیابی و رتبه‌بندی افراد خبره با هدف بازیابی و رتبه‌بندی افراد خبره در زمینه‌ی موضوع پرس‌وجوی کاربر، به‌عنوان یکی از مهم‌ترین مسائل موجود در این حوزه توجه بسیاری از پژوهشگران را به خود جلب نموده‌است. مهم‌ترین چالش در مسئله‌ی بازیابی افراد خبره تشخیص میزان ارتباط بین کلمات پرس‌وجو و سند‌های نوشته‌شده توسط ‌نامزد‌های خبرگی است. یک مشکل اساسی در این حوزه فاصله‌ی واژگانی میان کلمات پرس‌وجو و سند‌های نامزد‌های خبرگی است. در این مقاله دو مدل ترجمه‌‌ی جدید برای مدل‌سازی فاصله‌ی واژگانی ارائه شده‌است. مدل اول یک مدل احتمالاتی مبتنی‌بر خوشه‌بندی و مدل دوم مبتنی‌بر مدل‌سازی موضوعی است. در هر دو مدل، کلمات پرس‌وجو به مجموعه‌ای از کلمات مرتبط با پرس‌وجو که بیشتر نشان‌دهنده‌ی یک زمینه‌ی خبرگی هستند ترجمه شده‌است. پس از ترجمه‌ی کلمات، از یک مدل ترکیب‌ کننده‌ به‌منظور بازیابی استفاده شده‌است. مدل‌های ارائه‌شده بر‌روی مجموعه‌ی آزمون stack overflow ارزیابی و تحلیل شده‌است. نتایج به‌دست‌آمده بیانگر افزایش میانگین متوسط دقت روش ارائه‌شده در مقایسه با سایر روش‌های بازیابی افراد خبره است.
کلیدواژه بازیابی افراد خبره، مدل ترجمه‌، خوشه‌بندی، مدل‌سازی موضوعی، فاصله‌ی واژگانی، سیستم‌های پاسخ به پرسش
آدرس دانشگاه شهید بهشتی, دانشکده مهندسی و علوم کامپیوتر, ایران, دانشگاه شهید بهشتی, دانشکده مهندسی و علوم کامپیوتر, ایران
پست الکترونیکی a_abin@sbu.ac.ir
 
   Retrieve and Rank the Experts Using a Cluster-based Translation Model  
   
Authors Dehghan M. ,Abin A. A.
Abstract    With respect to the increasing volume and variety of information available on the Web, it is very difficult to find the required knowledge through the massive amount of data. Questionanswering systems have been created to make easy knowledge accessing through massive amounts of data. The most important factor in the issue of expert finding is the ability to detect the relationship between query words and documents written by the candidate experts. A challenging issue in this area is the vocabulary gap between query words and the documents of the candidate experts. In this paper, two new translation models are proposed to solve the problem of the vocabulary gap. First model, a clusterbased probabilistic model, and another is based on topic modeling. In these models, the query words are translated into a collection of queryrelated words, which are written in documents written by more candidate experts. Then, using these words and using a simple composite model, we have retrieved the experts. The proposed models are implemented and evaluated on the Stackoverflow test set and finally, we have analyzed the outputs. The results indicate an increase in the Mean Average Precision of the proposed method compared with other methods of expert finding.
Keywords
 
 

Copyright 2023
Islamic World Science Citation Center
All Rights Reserved