سیستم برچسبگذاری اجزای واژگانی کلام در زبان فارسی
|
|
|
|
|
نویسنده
|
محسنی مهدی ,مینایی بیدگلی بهروز
|
منبع
|
پردازش علائم و داده ها - 1388 - دوره : 2 - شماره : 12 - صفحه:13 -27
|
چکیده
|
برچسبگذاری اجزای واژگانی کلام، موضوع تحقیقاتی مهمی در حوزه ی پردازش زبان طبیعی است و پایه ی بسیاری از دیگر مباحث مطرح در این حوزه است. تاکنون تحقیقات گستردهای با رویکردهای متعدد در زبانهای دیگر انجام و نتایج چشمگیری حاصل شده است. این موضوع سنگ بنای بسیاری از روشهای مورد استفاده در حوزههای دیگر پردازش زبان طبیعی، همچون ترجمه ی ماشینی، خطایاب، تبدیل متن به گفتار، تشخیص گفتار است، فعّالیت بر روی این موضوع تحقیقاتی میتواند راهگشای این مباحث در زبان فارسی باشد. در این مقاله با بیان مسایل پیش رو در برچسبگذاری اجزای واژگانی کلام در زبان فارسی، یک طرح کلی برای نیل به یک برچسبگذار خودکار با دقت بالا در زبان فارسی پیشنهاد میگردد. پس از آن تحلیل ساختواژی و استفاده از آن را برای پوشش دادن تعداد زیادی از برچسبهای پیکره با حفظ دقّت بالا در برچسبگذاری کلمات مورد بررسی دقیقتر قرار داده و تاثیر وجود یک تحلیلگر ساختواژی در سطح تصریف را بر برچسبگذاری اجزای واژگانی کلام در زبان فارسی بررسی می کنیم. نتایج به دست آمده نشان از کارآیی بسیار مناسب این روش پیشنهادی در برچسبگذاری دارد.
|
کلیدواژه
|
برچسبگذاری اجزای واژگانی کلام ,ساخت واژه ,برچسبگذارهای مارکوفی ,برچسبگذار مبتنی بر حافظه
|
آدرس
|
دانشگاه علم و صنعت ایران, ایران, دانشگاه علم و صنعت ایران, ایران
|
پست الکترونیکی
|
b_minaei@iust.ac.ir
|
|
|
|
|