|
|
شناسایی رابطه تقابل در گفتمان فارسی بهکمک روشهای یادگیری باسرپرستی
|
|
|
|
|
نویسنده
|
خدادادی حبیب ,راحتی قوچانی سعید ,استاجی اعظم
|
منبع
|
پردازش علائم و داده ها - 1394 - دوره : 12 - شماره : 2 - صفحه:13 -22
|
چکیده
|
گفتمان به هر قطعه یا پاره ای از زبان گفته می شود که به قصد برقراری ارتباط بهکاربرده شده باشد . سامانه شناسایی روابط موجود در گفتمان، روابط موجود بین واحدهای متنی یک گفتمان را شناسایی میکند. یکی از روابط موجود در گفتمان های زبان فارسی رابطه تقابل است که شناسایی آن به توانایی تولید و درک گفتمان کمک می کند و در سامانه های متعددی مانند خلاصه ساز، تفسیر و... کاربرد دارد. رابطه تقابل می تواند به کمک نقش نماهای خاص رابطه تقابل مانند «اما» و «ولی» شناسایی شود؛ اما در بعضی موارد این نقش نماها حذف میشوند و شناسایی رابطه را با مشکل مواجه می کنند و باید از ویژگی هایی مانند زمان فعل ها، جفت کلمات و ... برای شناسایی استفاده کرد. برای انجام آزمایش ها، 10000 نمونه از رابطه تقابل و سایر روابط از پیکره متنی پژوهشکده هوشمند علایم بهعنوان مجموعه داده گردآوری شد. از این نمونهها، بردار ویژگی استخراج شد و در نهایت برای دسته بندی و تشخیص رابطه تقابل از چند روش یادگیری باسرپرستی شامل ماشین بردار پشتیبان، k نزدیکترین همسایه، پنجره پارزن و همچنین ترکیب این دسته بندها استفاده شد. بهترین میزان صحت 13/87 و مربوط به ترکیب دسته بندها در بهترین حالت است.
|
کلیدواژه
|
پردازش زبان طبیعی ,گفتمان ,نقش نمای گفتمان ,شناسایی رابطه تقابل ,یادگیری باسرپرستی
|
آدرس
|
دانشگاه آزاد اسلامی واحد میناب, گروه مهندسی کامپیوتر، واحد میناب، دانشگاه آزاد اسلامی، میناب، ایران, ایران, دانشگاه آزاد اسلامی واحد مشهد, گروه مهندسی برق، واحد مشهد، دانشگاه آزاد اسلامی، مشهد، ایران, ایران, دانشگاه فردوسی مشهد, گروه زبانشناسی همگانی، دانشکده ادبیات و علوم انسانی، دانشگاه فردوسی مشهد، مشهد، ایران, ایران
|
پست الکترونیکی
|
estaji@um.ac.ir
|
|
|
|
|
|
|
|
|
|
|
|
Authors
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|