|
|
استخراج رابطه مبتنی بر تعبیه لغات با فرآیند جمعسپاری
|
|
|
|
|
نویسنده
|
جعفرآباد محمد ,دیانت روح الله
|
منبع
|
پردازش علائم و داده ها - 1401 - شماره : 1 - صفحه:101 -110
|
چکیده
|
برای انجام مطالعات دادهکاوی، تاحدودی بهدلیل پیچیدهبودن فرآیند انتخاب ویژگی در کار مورد نظر، نیاز داریم تا بخشی از برچسبزنی را به کارگران در فعالیت جمع سپاری واگذار کنیم. فرآیند واگذاری کارهای دادهکاوی به کاربران، اغلب بهوسیله سامانههای نرمافزاری و بدون اطلاع دقیق از موقعیت سنی یا جغرافیای محل سکونت کاربران صورت میگیرد. عدم اطمینان از عملکرد کاربران مجازی در جمع سپاری، میزان صحت اطلاعات دریافتی را کاهش میدهد. در این مقاله پیشنهاد دادهایم تا با استفاده از روشهای ایجاد انگیزش، تعدادی از مردم را در محلی جمع و از آنها در جهت وظایف جمع سپاری استفاده کنیم. افزایش دقت در اعلام نتایج بهدلیل حضور فیزیکی، سرعت بالا در گرفتن نتایج با دقت بالا در زمان تعیینشده، تحصیلات مناسب شرکتکنندگان در فعالیت و بومیبودن طرح اجرایی از ویژگی های این پژوهش هستند. در این پژوهش یک کار یادگیری ماشین انجام شد تا بتوانیم در ضمن آن فعالیت های جمعسپاری را با الگوریتم های شبکه عصبی عمیق ترکیب نماییم. وظیفه کلاسبندی برای تعبیه لغات بهصورت الگوریتمی و تلفیقی با کمک جمعسپاری انجام می شود. روش پیشنهادی با افزودن دادههای جمعسپار به دادههای قبلی و تغییرات در مدل تعبیه لغات ترکیبی گلاو و وردتووک توانست نتایج مناسبی را در استخراج ویژگی بهدست بیاورد.
|
کلیدواژه
|
جمعسپاری، تعبیه لغات، گلاو، وردتووک، طبقهبندی
|
آدرس
|
دانشگاه قم, دانشکده فنی و مهندسی, گروه مهندسی فناوری اطلاعات, ایران, دانشگاه قم, دانشکده فنی و مهندسی, گروه مهندسی فناوری اطلاعات, ایران
|
پست الکترونیکی
|
rouhollahdianat@gmail.com
|
|
|
|
|
|
|
|
|
Relation extraction based on word embedding with Crowdsourcing Process
|
|
|
Authors
|
jafarabad mohammad ,Dianat Rouhollah
|
Abstract
|
For data mining studies, due to the complexity of doing feature selection process in tasks by hand, we need to send some of labeling to the workers with crowdsourcing activities. The process of outsourcing data mining tasks to users is often handled by software systems without enough knowledge of the age or geography of the users #39; residence. We use convolutional neural network, for doing classification in six classes: USAGE, TOPIC, COMPARE, MODELFEATURE, RESULT and PARTWHOLE. This article extracts the data from the abstract of 450 scientific articles and it is a total of 835 relations. One hundred of these abstracts have been selected by the crowdsourcing. Classification results in this article have been done with a slight improvement in accuracy. In this study, we computed the classification results on a combination of vocabulary vectors with using of 450 abstract relation data (100 crowd source datasets with 350 standards). The results of the implementation of the classification algorithm give us performance improvement. This paper uses the population power to perform preparing data mining works. The proposed method by adding crowdsource data to the previous data was able to obtain better results rather than the top 5 methods.
|
Keywords
|
Glove ,Word2vec ,Crowdsourcing ,word embedding ,classification
|
|
|
|
|
|
|
|
|
|
|