>
Fa   |   Ar   |   En
   تشخیص اسامی اشخاص با استفاده از افزایش کلمه‌های نامزد اسم در میدان‌های تصادفی شرطی برای زبان عربی  
   
نویسنده عسگری بیدهندی مجید ,مینایی بیدگلی بهروز
منبع پردازش علائم و داده ها - 1393 - دوره : 11 - شماره : 21 - صفحه:73 -85
چکیده    تشخیص و استخراج واحدهای اسمی مانند نام اشخاص، مکان‌ها، تاریخ و ساعت، در داده‌کاوی از یک منبع الکترونیکی یا متنی بسیار مفید است. تشخیص درست واحدهای اسمی، یک نیاز مهم در حل مسایلی در حوزه‌های جدید مانند پاسخ‌گویی به سوال‌ها، سیستم‌های خلاصه‌سازی، بازیابی اطلاعات، استخراج اطلاعات، ترجمه ماشینی، تفسیر ویدیویی و جستجوی معنایی در وب است. به‌علاوه، تشخیص واحدهای اسمی می‌تواند به ما در حل پیشرفته‌ترین مسایل پردازش زبان طبیعی هم‌چون رفع ابهام معنایی میان دو نام مشترک از رشته‌های متفاوت، پیدا کرد ارجاع‌ها در مقالات علمی، تشخیص وابستگی میان اشخاص و بهبود نتایج پرس و جوهایی شامل اسامی در موتورهای جستجو کمک کند.در سال‌های گذشته تلاش دانشمندان برای انجام عملیات تشخیص واحدهای اسمی برای زبان انگلیسی و دیگر زبان‌های اروپایی به نتایج بسیار خوبی منجر شده است، اما برای زبان‌هایی مانند فارسی و عربی، نتایج مناسب حاصل نشده‌ است. یکی از اصلی‌ترین اهداف عملیات تشخیص واحدهای اسمی، تشخیص اسامی اشخاص است. در این مقاله سامانه‌ای برای تشخیص اسامی با به‌کارگیری مفهوم «کلمه‌های نامزد اسم» در مراحل آموزش و پیش‌بینیِ مدلی مبتنی بر میدان‌های تصادفی شرطی معرفی شده است. به‌طورخاص،‌ همراه با توسعه این سامانه، پیکره‌های متنی استانداردی از روی متون دینی کهن به زبان عربی ساخته شده‌ است. همچنین حاصل کار سامانه بر روی داده‌های روزنامه‌ای که توسط محققان دیگر ایجاد شده، بررسی شده است و نتایج به‌دست آمده در مقایسه با نتایج سامانه‌های دیگر روی همان داده‌ها، نشان می‌دهد با استفاده از این روش، دقت تشخیص اسامی در متون عربی به مقدار قابل توجهی بالا رفته است.
کلیدواژه تشخیص واحدهای اسمی ,یادگیری ماشین ,میدان‌های تصادفی شرطی ,زبان فارسی ,زبان عربی
آدرس دانشگاه علم و صنعت ایران, دانشکده کامپیوتر, ایران, دانشگاه علم و صنعت ایران, دانشکده کامپیوتر, ایران
پست الکترونیکی b_minaei@iust.ac.ir
 
     
   
Authors
  
 
 

Copyright 2023
Islamic World Science Citation Center
All Rights Reserved