|
|
تشخیص اسامی اشخاص با استفاده از افزایش کلمههای نامزد اسم در میدانهای تصادفی شرطی برای زبان عربی
|
|
|
|
|
نویسنده
|
عسگری بیدهندی مجید ,مینایی بیدگلی بهروز
|
منبع
|
پردازش علائم و داده ها - 1393 - دوره : 11 - شماره : 21 - صفحه:73 -85
|
چکیده
|
تشخیص و استخراج واحدهای اسمی مانند نام اشخاص، مکانها، تاریخ و ساعت، در دادهکاوی از یک منبع الکترونیکی یا متنی بسیار مفید است. تشخیص درست واحدهای اسمی، یک نیاز مهم در حل مسایلی در حوزههای جدید مانند پاسخگویی به سوالها، سیستمهای خلاصهسازی، بازیابی اطلاعات، استخراج اطلاعات، ترجمه ماشینی، تفسیر ویدیویی و جستجوی معنایی در وب است. بهعلاوه، تشخیص واحدهای اسمی میتواند به ما در حل پیشرفتهترین مسایل پردازش زبان طبیعی همچون رفع ابهام معنایی میان دو نام مشترک از رشتههای متفاوت، پیدا کرد ارجاعها در مقالات علمی، تشخیص وابستگی میان اشخاص و بهبود نتایج پرس و جوهایی شامل اسامی در موتورهای جستجو کمک کند.در سالهای گذشته تلاش دانشمندان برای انجام عملیات تشخیص واحدهای اسمی برای زبان انگلیسی و دیگر زبانهای اروپایی به نتایج بسیار خوبی منجر شده است، اما برای زبانهایی مانند فارسی و عربی، نتایج مناسب حاصل نشده است. یکی از اصلیترین اهداف عملیات تشخیص واحدهای اسمی، تشخیص اسامی اشخاص است. در این مقاله سامانهای برای تشخیص اسامی با بهکارگیری مفهوم «کلمههای نامزد اسم» در مراحل آموزش و پیشبینیِ مدلی مبتنی بر میدانهای تصادفی شرطی معرفی شده است. بهطورخاص، همراه با توسعه این سامانه، پیکرههای متنی استانداردی از روی متون دینی کهن به زبان عربی ساخته شده است. همچنین حاصل کار سامانه بر روی دادههای روزنامهای که توسط محققان دیگر ایجاد شده، بررسی شده است و نتایج بهدست آمده در مقایسه با نتایج سامانههای دیگر روی همان دادهها، نشان میدهد با استفاده از این روش، دقت تشخیص اسامی در متون عربی به مقدار قابل توجهی بالا رفته است.
|
کلیدواژه
|
تشخیص واحدهای اسمی ,یادگیری ماشین ,میدانهای تصادفی شرطی ,زبان فارسی ,زبان عربی
|
آدرس
|
دانشگاه علم و صنعت ایران, دانشکده کامپیوتر, ایران, دانشگاه علم و صنعت ایران, دانشکده کامپیوتر, ایران
|
پست الکترونیکی
|
b_minaei@iust.ac.ir
|
|
|
|
|
|
|
|
|
|
|
|
Authors
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|