|
|
طبقهبندی متون فارسی مبتنی بر شبکههای عصبی عمیق
|
|
|
|
|
نویسنده
|
فیضیدرخشی محمدرضا ,متقی نیا زینب ,عسگری چناقلو میثم
|
منبع
|
محاسبات نرم - 1401 - دوره : 11 - شماره : 1 - صفحه:120 -139
|
چکیده
|
امروزه با توجه به رشد روزافزون حجم اسناد الکترونیکی، طبقهبندی متون بر اساس روشهای مختلفی در میان محققین بازیابی اطلاعات و متون عمومیت یافته است. با توجه به اهمیت موضوع و کارهایی که در این زمینه در زبانهای مختلف دنیا انجام گرفته است، نیاز به طبقهبندی متون فارسی به خوبی احساس میشود. به طور کلی روشهای طبقهبندی متون را میتوان به روشهای سنتی (مبتنی بر انتخاب ویژگی و یادگیری ماشین) و روشهای مبتنی بر یادگیری عمیق تقسیمبندی کرد. روشهای مبتنی بر یادگیری عمیق به دلیل توانایی اشتراک وزن به طور قابل توجهی سبب کاهش تعداد متغیرهای آزاد آموزشپذیر شبکه و در نتیجه افزایش تعمیمپذیری شده است و نتایج بهتری به نسبت سایر روشها میدهد. در زبان فارسی روشهای مبتنی بر یادگیری عمیق بسیار اندکی برای طبقهبندی متون ارائهشده است. در این مقاله دو مدل شبکه عصبی عمیق شامل شبکه عصبی پیچشی parscnn و شبکه عصبی با حافظه بلند کوتاه- مدت دوسویه سلسهمراتبی با لایه توجه parsbilstm برای طبقهبندی متون فارسی تشریح شده است. کارایی سیستمهای مبتنی بر شبکه عصبی عمیق بر روی مجموعه داده همشهری بررسی شده و از نظر سه معیار ارزیابی دقت، فراخوانی و مقیاس-f مورد مطالعه قرار گرفته است. نتایج آزمایشها نشان میدهد که روش parscnn میزان دقت 0.69، فراخوانی 0.7 و مقیاس-f 0.69؛ همچنین روش parsbilstm میزان دقت 0.72، فراخوانی 0.73 و مقیاس-f 0.72 دارند که نشاندهنده کارایی بالاتر این روشها نسبت به روشهای طبقهبندی متون فارسی مورد مطالعه است.
|
کلیدواژه
|
طبقهبندی متون، شبکههای عصبی عمیق، بردار نمایش کلمات، تعبیه کلمات، یادگیری ماشین
|
آدرس
|
دانشگاه تبریز, دانشکده مهندسی برق و کامپیوتر, ایران, دانشگاه تبریز, دانشکده مهندسی برق و کامپیوتر, ایران, دانشگاه تبریز, دانشکده مهندسی برق و کامپیوتر, ایران
|
پست الکترونیکی
|
m.asgari.c@gmail.com
|
|
|
|
|
|
|
|
|
persian text classification based on deep neural networks
|
|
|
Authors
|
feizi-derakhshi mohammad-reza ,mottaghinia zeynab ,asgari-chenaghlu meysam
|
Abstract
|
nowadays, according to the growing volume of electronic documents, the classification of text has attracted the attention of information retrieval researchers. considering the importance of text classification and the efforts done in this field in several languages in the world, the necessity of persian text classification is understood. in general, we can classify text classification methods into two classes, including traditional methods (based on feature selection and machine learning) and methods based on deep learning. deep learning methods, due to the ability of weight sharing, significantly reduce the number of trainable parameters and thus increase generalization and provide better results than other methods. there are a few methods based on deep learning for persian text classification. in this study, we propose to use cnn and blstm with an attention layer for persian text classification named parscnn and parsbilstm. the experimental results on the hamshahri dataset show that the parscnn method has a precision of 0.69, a recall of 0.7, and, an f-score of 0.69; also, the parsbilstm method has a precision of 0.72, a recall of 0.73 and, an f-score of 0.72, which indicates the methods based on deep neural networks have better performance than other approaches.
|
|
|
|
|
|
|
|
|
|
|
|
|