>
Fa   |   Ar   |   En
   مروری بر روش‌ها و پژوهش‌های دسته‌بندی خودکار متون فارسی  
   
نویسنده پارسافرد پویان ,ویسی هادی
منبع علوم رايانشي - 1398 - دوره : 4 - شماره : 2 - صفحه:35 -56
چکیده    دسته‌بندی اسناد متنی یا تشخیص عنوان به فرآیند شناسایی خودکار موضوع یک سند متنی (مانند هنری، ورزشی، سیاسی، علمی و ...) گفته می‌شود که در کاربردهای مختلف پردازش زبان طبیعی مانند بازیابی اطلاعات و تحلیل متون مورد استفاده است. یک سامانه دسته‌بندی‌کننده خودکار متون، مشابه اغلب سامانه‌های بازشناسی الگو، از دو گام مهم استخراج ویژگی و دسته‌بندی تشکیل شده است. در این مقاله، مروری بر روش‌های رایج برای استخراج ویژگی و دسته‌بندی در این سامانه‌ها صورت گرفته و پژوهش‌هایی که در این حوزه برای زبان فارسی انجام شده است، مرور شده‌اند. همچنین، تحلیلی از نقاط قوت و ضعف روش‌های موجود و مقایسه کارهای صورت گرفته با همدیگر ارائه شده است.
کلیدواژه دسته بندی متون فارسی، پردازش زبان طبیعی، مرور روش ها، استخراج ویژگی و دسته بندی
آدرس دانشگاه تهران، پردیس بین المللی, ایران, دانشگاه تهران, دانشکده علوم و فنون نوین, ایران
پست الکترونیکی h.veisi@ut.ac.ir
 
     
   
Authors
  
 
 

Copyright 2023
Islamic World Science Citation Center
All Rights Reserved