>
Fa   |   Ar   |   En
   ارائه مدلی جهت پیش ‌بینی ارتباط بین واحدهای دانشی در وب سایت‌های پرسش و پاسخ برنامه‌ نویسی با استفاده از تکنیک ‌های یادگیری عمیق: مطالعه ‌موردی stack overflow  
   
نویسنده عباسی مهر حسین ,خودی زاده نهاری محمد
منبع مهندسي برق دانشگاه تبريز - 1403 - دوره : 54 - شماره : 1 - صفحه:45 -54
چکیده    وب‌ سایت stack overflow یکی از محبوب‌ترین جوامعی است که میلیون‌ها برنامه‌نویس از آن استفاده می‌کنند. اگر یک سوال و پاسخ‌های متناظر با آن را یک واحد دانشی در نظر بگیریم، آنگاه بین واحدهای دانشی ارتباط مختلف معنایی وجود دارد که این ارتباط شامل ارتباط تکراری، ارتباط مستقیم، ارتباط غیرمستقیم با سوال طرح‌شده است. تشخیص دسته‌های مختلف ارتباط معنایی بین واحدهای دانشی در stack overflow می‌تواند اثربخشی و کارایی جستجوی اطلاعات را به‌طور چشمگیری بهبود بخشد. در این مطالعه، یک رویکرد ترکیبی مبتنی بر روش‌های یادگیری عمیق و معیارهای تشابه سنتی جهت تشخیص ارتباط بین سوالات ارائه می‌شود. به‌طور خاص دو معماری شبکه عمیق ارائه می‌شود که معماری اول از شبکه حافظه کوتاه‌مدت طولانی دوطرفه و همچنین لایه محاسبه کننده شباهت کسینوسی تشکیل شده است. معماری دوم گسترش یافته‌ی معماری اول با اضافه کردن مکانیزم توجه است. رویکرد پیشنهادی روی یک مجموعه داده سوالات زبان برنامه‌نویسی جاوا شامل 40000 مورد ارزیابی قرار گرفت. نتایج به‌دست‌آمده نشان می‌دهد که در معیار‌های f1، recall و precision مدل پیشنهادی عملکرد بهتری نسبت به مدل‌های موجود از خود نشان می‌دهد. به طور خاص مدل پیشنهادی در این مقاله در معیار f1 بهبود 17.3 درصدی نسبت به برترین مدل فعلی دارد. همچنین نتایج آزمایش‌ها نشان می‌دهد که استفاده از مدل تعبیه کلمات از پیش آموزش‌دیده به‌طور قابل‌ملاحظه‌ای عملکرد مدل‌های ارائه‌شده را بهبود می‌بخشد.
کلیدواژه تشخیص ارتباط، دسته‌بندی چند کلاسه، روش bilstm، مکانیزم توجه، معیارهای شباهت متن
آدرس دانشگاه شهید مدنی آذربایجان, دانشکده فناوری اطلاعات و مهندسی کامپیوتر, ایران, دانشگاه شهید مدنی آذربایجان, دانشکده فناوری اطلاعات و مهندسی کامپیوتر, ایران
پست الکترونیکی m.khodizadeh@azaruniv.ac.ir
 
   proposing a model to predict relatedness between knowledge units in programming question-answering websites using deep learning techniques: a case study of stack  
   
Authors abbasimehr hossein ,khodizadeh nahari mohammad
Abstract    the stack overflow website is one of the most popular communities used by millions of programmers. if we consider a question and its corresponding answers as a knowledge unit on the stack overflow website, then there are different semantic relationships between two knowledge units, which include duplicate, direct, and indirect relationships with the proposed question. recognizing different categories of semantic relationship between knowledge units in stack overflow can significantly improve the effectiveness and efficiency of information search. in this study, a hybrid approach based on deep learning methods and traditional similarity criteria is presented to detect the relationship between questions. in particular, two deep network architectures are presented, the first architecture consists of a long short-term memory network as well as a cosine similarity calculation layer. the second architecture is an extension of the first architecture by adding an attention mechanism. the proposed approach was evaluated on a dataset of java programming language contining 40000 questions. the obtained results show that in terms of f1, recall and precision, the proposed model performs better than the existing models. specifically, the model proposed in this article has a 17.3% improvement in terms of f1 measure compared to the best current model. also, the results of the experiments show that using the pre-trained word embedding model significantly improves the performance of the presented models.
Keywords relatedness prediction ,multiclass classification ,bilstm method ,attention mechanism ,text similarity measures
 
 

Copyright 2023
Islamic World Science Citation Center
All Rights Reserved