|
|
بازیابی و رتبهبندی افراد خبره با استفاده از مدل ترجمه مبتنیبر خوشهبندی
|
|
|
|
|
نویسنده
|
دهقان مهدی ,آبین احمدعلی
|
منبع
|
مهندسي برق دانشگاه تبريز - 1398 - دوره : 49 - شماره : 3 - صفحه:1095 -1106
|
چکیده
|
استخراج دانش از میان دادههای موجود در وب باتوجه به حجم و تنوع بالای آن به یک چالش در حوزهی بازیابی اطلاعات تبدیل شدهاست. در این میان، مسالهی بازیابی و رتبهبندی افراد خبره با هدف بازیابی و رتبهبندی افراد خبره در زمینهی موضوع پرسوجوی کاربر، بهعنوان یکی از مهمترین مسائل موجود در این حوزه توجه بسیاری از پژوهشگران را به خود جلب نمودهاست. مهمترین چالش در مسئلهی بازیابی افراد خبره تشخیص میزان ارتباط بین کلمات پرسوجو و سندهای نوشتهشده توسط نامزدهای خبرگی است. یک مشکل اساسی در این حوزه فاصلهی واژگانی میان کلمات پرسوجو و سندهای نامزدهای خبرگی است. در این مقاله دو مدل ترجمهی جدید برای مدلسازی فاصلهی واژگانی ارائه شدهاست. مدل اول یک مدل احتمالاتی مبتنیبر خوشهبندی و مدل دوم مبتنیبر مدلسازی موضوعی است. در هر دو مدل، کلمات پرسوجو به مجموعهای از کلمات مرتبط با پرسوجو که بیشتر نشاندهندهی یک زمینهی خبرگی هستند ترجمه شدهاست. پس از ترجمهی کلمات، از یک مدل ترکیب کننده بهمنظور بازیابی استفاده شدهاست. مدلهای ارائهشده برروی مجموعهی آزمون stack overflow ارزیابی و تحلیل شدهاست. نتایج بهدستآمده بیانگر افزایش میانگین متوسط دقت روش ارائهشده در مقایسه با سایر روشهای بازیابی افراد خبره است.
|
کلیدواژه
|
بازیابی افراد خبره، مدل ترجمه، خوشهبندی، مدلسازی موضوعی، فاصلهی واژگانی، سیستمهای پاسخ به پرسش
|
آدرس
|
دانشگاه شهید بهشتی, دانشکده مهندسی و علوم کامپیوتر, ایران, دانشگاه شهید بهشتی, دانشکده مهندسی و علوم کامپیوتر, ایران
|
پست الکترونیکی
|
a_abin@sbu.ac.ir
|
|
|
|
|
|
|
|
|
Retrieve and Rank the Experts Using a Cluster-based Translation Model
|
|
|
Authors
|
Dehghan M. ,Abin A. A.
|
Abstract
|
With respect to the increasing volume and variety of information available on the Web, it is very difficult to find the required knowledge through the massive amount of data. Questionanswering systems have been created to make easy knowledge accessing through massive amounts of data. The most important factor in the issue of expert finding is the ability to detect the relationship between query words and documents written by the candidate experts. A challenging issue in this area is the vocabulary gap between query words and the documents of the candidate experts. In this paper, two new translation models are proposed to solve the problem of the vocabulary gap. First model, a clusterbased probabilistic model, and another is based on topic modeling. In these models, the query words are translated into a collection of queryrelated words, which are written in documents written by more candidate experts. Then, using these words and using a simple composite model, we have retrieved the experts. The proposed models are implemented and evaluated on the Stackoverflow test set and finally, we have analyzed the outputs. The results indicate an increase in the Mean Average Precision of the proposed method compared with other methods of expert finding.
|
Keywords
|
|
|
|
|
|
|
|
|
|
|
|