|
|
ارائه مدلی جهت پیش بینی ارتباط بین واحدهای دانشی در وب سایتهای پرسش و پاسخ برنامه نویسی با استفاده از تکنیک های یادگیری عمیق: مطالعه موردی stack overflow
|
|
|
|
|
نویسنده
|
عباسی مهر حسین ,خودی زاده نهاری محمد
|
منبع
|
مهندسي برق دانشگاه تبريز - 1403 - دوره : 54 - شماره : 1 - صفحه:45 -54
|
چکیده
|
وب سایت stack overflow یکی از محبوبترین جوامعی است که میلیونها برنامهنویس از آن استفاده میکنند. اگر یک سوال و پاسخهای متناظر با آن را یک واحد دانشی در نظر بگیریم، آنگاه بین واحدهای دانشی ارتباط مختلف معنایی وجود دارد که این ارتباط شامل ارتباط تکراری، ارتباط مستقیم، ارتباط غیرمستقیم با سوال طرحشده است. تشخیص دستههای مختلف ارتباط معنایی بین واحدهای دانشی در stack overflow میتواند اثربخشی و کارایی جستجوی اطلاعات را بهطور چشمگیری بهبود بخشد. در این مطالعه، یک رویکرد ترکیبی مبتنی بر روشهای یادگیری عمیق و معیارهای تشابه سنتی جهت تشخیص ارتباط بین سوالات ارائه میشود. بهطور خاص دو معماری شبکه عمیق ارائه میشود که معماری اول از شبکه حافظه کوتاهمدت طولانی دوطرفه و همچنین لایه محاسبه کننده شباهت کسینوسی تشکیل شده است. معماری دوم گسترش یافتهی معماری اول با اضافه کردن مکانیزم توجه است. رویکرد پیشنهادی روی یک مجموعه داده سوالات زبان برنامهنویسی جاوا شامل 40000 مورد ارزیابی قرار گرفت. نتایج بهدستآمده نشان میدهد که در معیارهای f1، recall و precision مدل پیشنهادی عملکرد بهتری نسبت به مدلهای موجود از خود نشان میدهد. به طور خاص مدل پیشنهادی در این مقاله در معیار f1 بهبود 17.3 درصدی نسبت به برترین مدل فعلی دارد. همچنین نتایج آزمایشها نشان میدهد که استفاده از مدل تعبیه کلمات از پیش آموزشدیده بهطور قابلملاحظهای عملکرد مدلهای ارائهشده را بهبود میبخشد.
|
کلیدواژه
|
تشخیص ارتباط، دستهبندی چند کلاسه، روش bilstm، مکانیزم توجه، معیارهای شباهت متن
|
آدرس
|
دانشگاه شهید مدنی آذربایجان, دانشکده فناوری اطلاعات و مهندسی کامپیوتر, ایران, دانشگاه شهید مدنی آذربایجان, دانشکده فناوری اطلاعات و مهندسی کامپیوتر, ایران
|
پست الکترونیکی
|
m.khodizadeh@azaruniv.ac.ir
|
|
|
|
|
|
|
|
|
proposing a model to predict relatedness between knowledge units in programming question-answering websites using deep learning techniques: a case study of stack
|
|
|
Authors
|
abbasimehr hossein ,khodizadeh nahari mohammad
|
Abstract
|
the stack overflow website is one of the most popular communities used by millions of programmers. if we consider a question and its corresponding answers as a knowledge unit on the stack overflow website, then there are different semantic relationships between two knowledge units, which include duplicate, direct, and indirect relationships with the proposed question. recognizing different categories of semantic relationship between knowledge units in stack overflow can significantly improve the effectiveness and efficiency of information search. in this study, a hybrid approach based on deep learning methods and traditional similarity criteria is presented to detect the relationship between questions. in particular, two deep network architectures are presented, the first architecture consists of a long short-term memory network as well as a cosine similarity calculation layer. the second architecture is an extension of the first architecture by adding an attention mechanism. the proposed approach was evaluated on a dataset of java programming language contining 40000 questions. the obtained results show that in terms of f1, recall and precision, the proposed model performs better than the existing models. specifically, the model proposed in this article has a 17.3% improvement in terms of f1 measure compared to the best current model. also, the results of the experiments show that using the pre-trained word embedding model significantly improves the performance of the presented models.
|
Keywords
|
relatedness prediction ,multiclass classification ,bilstm method ,attention mechanism ,text similarity measures
|
|
|
|
|
|
|
|
|
|
|