طبقهبندی متن بر اساس رویکرد ترکیبی از تجزیه مقادیر منفرد و ماشین برادر پشتیبان
|
|
|
DOR
|
20.1001.2.9920081484.1399.1.1.23.7
|
نویسنده
|
دامی سینا ,فرقانی نجمه
|
منبع
|
كنفرانس ملي تكنولوژي در مهندسي برق و كامپيوتر - 1399 - دوره : 5 - پنجمین کنفرانس ملی تکنولوژی در مهندسی برق و کامپیوتر - کد همایش: 99200-81484 - صفحه:1 -5
|
چکیده
|
در طبقهبندی متن هدف این است که سندهایی را که در اختیار داریم بتوانیم برچسبگذاری موضوعی کنیم. در واقع این موضوع صرفا یک مسئله باناظر است، یعنی مجموعهای از اسناد متنی که گروهبندی موضوعی شدهاند به عنوان دادهی آموزشی در اختیار سامانه قرار میگیرد تا بتواند با یادگیری از این مجموعه، اسناد جدید ورودی را به یکی از این گروههای موضوعی ملحق نماید. در طبقهبندی متن معمولا از کلمات متن به عنوان ویژگیهای آن متن استفاده میشود در نتیجه مسئله طبقهبندی متن با تعداد بالایی از ویژگیها مواجه میباشند. در این پژوهش از روش ماشین برادر پشتیبان برای طبقهبندی متن ها و تجزیه مقادیر منفرد برای انتخاب ویژگی های متن استفاده شده تا بتوان طبقهبندی متن را با کیفیت بالاتری به انجام رساند. برای سنجش نتایج حاصله از مقایسه روش ما با دو روش دیگر مبتنی بر knn و naive bayes استفاده شده است. در نتایج آزمایشگاهی مشاهده شد که روش پیشنهادی بهطور میانگین از هر دو روش بهتر است.
|
کلیدواژه
|
طبقهبندی متن ,ماشین برادر پشتیبان ,کاهش ویژگیها ,تجزیه مقادیر منفرد
|
آدرس
|
دانشگاه آزاد اسلامی واحد تهران غرب, دانشگاه آزاد اسلامی واحد تهران غرب
|
پست الکترونیکی
|
saeda.forghani@gmail.com
|
|
|
|
|