>
Fa   |   Ar   |   En
   طبقه‌بندی متون فارسی مبتنی بر شبکه‌های عصبی عمیق  
   
نویسنده فیضی‌درخشی محمدرضا ,متقی نیا زینب ,عسگری چناقلو میثم
منبع محاسبات نرم - 1401 - دوره : 11 - شماره : 1 - صفحه:120 -139
چکیده    امروزه با توجه به رشد روزافزون حجم اسناد الکترونیکی، طبقه‌بندی متون بر اساس روش‌های مختلفی در میان محققین بازیابی اطلاعات و متون عمومیت یافته است. با توجه به اهمیت موضوع و کارهایی که در این زمینه در زبان‌های مختلف دنیا انجام گرفته است، نیاز به طبقه‌بندی متون فارسی به خوبی احساس می‌شود. به طور کلی روش‌های طبقه‌بندی متون را می‌توان به روش‌های سنتی (مبتنی بر انتخاب ویژگی و یادگیری ماشین) و روش‌های مبتنی بر یادگیری عمیق تقسیم‌بندی کرد. روش‌های مبتنی بر یادگیری عمیق به دلیل توانایی اشتراک وزن به طور قابل توجهی سبب کاهش تعداد متغیرهای آزاد آموزش‌پذیر شبکه و در نتیجه افزایش تعمیم‌پذیری شده است و نتایج بهتری به نسبت سایر روش‌ها می‌دهد. در زبان فارسی روش‌های مبتنی بر یادگیری عمیق بسیار اندکی برای طبقه‌بندی متون ارائه‌شده است. در این مقاله دو مدل شبکه عصبی عمیق شامل شبکه عصبی پیچشی parscnn و شبکه عصبی با حافظه بلند کوتاه- مدت دوسویه سلسه‌مراتبی با لایه توجه parsbilstm برای طبقه‌بندی متون فارسی تشریح شده است. کارایی سیستم‌های مبتنی بر شبکه عصبی عمیق بر روی مجموعه داده همشهری بررسی شده و از نظر سه معیار ارزیابی دقت، فراخوانی و مقیاس-f مورد مطالعه قرار گرفته است. نتایج آزمایش‌ها نشان می‌دهد که روش parscnn میزان دقت 0.69، فراخوانی 0.7 و مقیاس-f 0.69؛ همچنین روش parsbilstm میزان دقت 0.72، فراخوانی 0.73 و مقیاس-f 0.72 دارند که نشان‌دهنده کارایی بالاتر این روش‌ها نسبت به روش‌های طبقه‌بندی متون فارسی مورد مطالعه است.
کلیدواژه طبقه‌بندی متون، شبکه‌های عصبی عمیق، بردار نمایش کلمات، تعبیه کلمات، یادگیری ماشین
آدرس دانشگاه تبریز, دانشکده مهندسی برق و کامپیوتر, ایران, دانشگاه تبریز, دانشکده مهندسی برق و کامپیوتر, ایران, دانشگاه تبریز, دانشکده مهندسی برق و کامپیوتر, ایران
پست الکترونیکی m.asgari.c@gmail.com
 
   persian text classification based on deep neural networks  
   
Authors feizi-derakhshi mohammad-reza ,mottaghinia zeynab ,asgari-chenaghlu meysam
Abstract    nowadays, according to the growing volume of electronic documents, the classification of text has attracted the attention of information retrieval researchers. considering the importance of text classification and the efforts done in this field in several languages in the world, the necessity of persian text classification is understood. in general, we can classify text classification methods into two classes, including traditional methods (based on feature selection and machine learning) and methods based on deep learning. deep learning methods, due to the ability of weight sharing, significantly reduce the number of trainable parameters and thus increase generalization and provide better results than other methods. there are a few methods based on deep learning for persian text classification. in this study, we propose to use cnn and blstm with an attention layer for persian text classification named parscnn and parsbilstm. the experimental results on the hamshahri dataset show that the parscnn method has a precision of 0.69, a recall of 0.7, and, an f-score of 0.69; also, the parsbilstm method has a precision of 0.72, a recall of 0.73 and, an f-score of 0.72, which indicates the methods based on deep neural networks have better performance than other approaches.
 
 

Copyright 2023
Islamic World Science Citation Center
All Rights Reserved