تشخیص موجودیت های اسمی بر پایه شبکه های عصبی با حافظه بلند کوتاه مدت پایدار
|
|
|
|
|
نویسنده
|
طهمورث نژاد جعفر ,علی پور نعیمه
|
منبع
|
علوم رايانشي - 1399 - دوره : 5 - شماره : 1 - صفحه:2 -14
|
چکیده
|
مسئلۀ شناسایی موجودیتهای اسمی بهعنوان یکی از شاخههای پردازش زبان طبیعی و زیرمجموعهای از استخراج اطلاعات بهشمار میرود. هدف اصلی در تشخیص موجودیتهای اسمی، دستهبندی اسامی خاص متن با برچسبهایی مانند شخص، مکان و سازمان است. امروزه اکثر روشهایی که برای این منظور معرفی شدهاند سعی در استفاده از ویژگیهایی دارند که مختص به یک زبان خاص نیست. از جمله این روشها میتوان به استفاده از شبکه عصبی با حافظه بلند مدت – کوتاه مدت اشارهکرد. آموزش این شبکههای عصبی بهوسیله استخراج ویژگیها از بردارهای کلمات در سطح نویسه و بردارهای کلمات از پیش آموزش دیده انجام میگیرد. دراین مقاله مدل جدیدی برای ساخت نمایشهای برداری کلمات پیشنهاد میشود که از ترکیب بردار نحوی کلمه با دو بردار کلمه قبلی بهدست میآید. بردار نحوی کلمه شامل اطلاعات نحوی موجود در جمله مانند موقعیت کلمه در جمله، نقش کلمات و ارتباط نحوی آنها با یکدیگر است. استفاده از این روش باعث توسعه سیستمهایی میشود که کمترین وابستگی را به دامنه دارند. کارایی روش پیشنهادی بر روی مجموعه داده موجودیتهای اسمی مورد ارزیابی قرار گرفتهاست. نتایج بهدست آمده، نشاندهنده بهبود قابل ملاحظهای در مقایسه با سایر روشهای مطرح در حوزه تشخیص موجودیتهای اسمی میباشد.
|
کلیدواژه
|
پردازش زبان طبیعی ,تشخیص موجودیتهای اسمی ,نمایش برداری کلمات ,شبکه عصبی با حافظه بلند مدت – کوتاه مدّت پایدار
|
آدرس
|
دانشگاه صنعتی ارومیه, دانشکده مهندسی فناوری اطلاعات و کامپیوتر, ایران, دانشگاه صنعتی ارومیه, دانشکده مهندسی فناوری اطلاعات و کامپیوتر, ایران
|
پست الکترونیکی
|
naimeh.alipour@it.uut.ac.ir
|
|
|
|
|