|
|
بهبود استخراج ویژگی با استفاده از یک مدل یادگیری عمیق گروهی برای تشخیص موجودیت
|
|
|
|
|
نویسنده
|
پارسایی مهر الهام ,فرتاش مهدی ,اکبری ترکستانی جواد
|
منبع
|
مدل سازي در مهندسي - 1401 - دوره : 20 - شماره : 69 - صفحه:103 -112
|
چکیده
|
یکی از مراحل اولیه در بیشتر پردازشهای زبان طبیعی، استخراج موجودیت نامدار از جمله است. در این زمینه تکنیکهای مختلف مبتنی بر یادگیری ماشین ارائه شده است که بدون نیاز به پیچیدگیهای استخراج ویژگی دستی، دقت بالاتری از خود نشان داده اند. لذا، دراین تحقیق ما برای گرفتن ویژگیهای جمله ورودی از ترکیب دو مدل یادگیری عمیق شامل شبکه عصبی کانولوشن و همینطور حافظه کوتاه مدت طولانی استفاده میکنیم. با استخراج ویژگیهای محلی کلمات توسط شبکه کانولوشن در کنار ویژگیهای سراسری، اطلاعات بیشتری از جمله جهت کلاسبندی دقیقتر موجودیتها بدست میآوریم. ما معماری پیشنهادیمان را روی دو دیتاست conll2003 و ace05 ارزیابی مینماییم و نشان میدهیم که افزودن شبکه کانولوشن سطح کلمه باعث استخراج اطلاعات محلی مفیدی از کلمات موجود در جمله میشود که منجر به افزایش دقت سیستم میگردد. در نهایت، کارایی سیستم را با دیگر رقبا مقایسه مینماییم و برتری این معماری نسبت به دیگران گزارش داده میشود.
|
کلیدواژه
|
تشخیص موجودیت نامدار، تعبیه گذاری کلمه، lstm ,cnn ,پردازش زبان طبیعی
|
آدرس
|
دانشگاه آزاد اسلامی واحد شوشتر, دانشکده مهندسی کامپیوتر, ایران, دانشگاه آزاد اسلامی واحد اراک, دانشکده مهندسی کامپیوتر, ایران, دانشگاه آزاد اسلامی واحد اراک, دانشکده مهندسی کامپیوتر, ایران
|
پست الکترونیکی
|
iau.akbari@gmail.com
|
|
|
|
|
|
|
|
|
an ensemble deep learning model to enhance feature representation for entity detection
|
|
|
Authors
|
parsaeimehr elham ,fartash mehdi ,akbari torkestani javad
|
Abstract
|
one of the main processes in most natural language processing (nlp), is named entity recognition (ner). in this regard, some machine learning techniques have been presented that traditionally use manual features. also, in recent years, deep neural networkbased models have been proposed that achieve higher accuracy without relying on huge computations for feature engineering. thus, in this article, we employ a combination of two deep learning models to capture the properties of the input sentence, including: long short term memory (lstm) and convolutional neural network (cnn). in this architecture, extracting local features along with global features, more information is acquired for more accurate classification. we evaluate the performance of this architecture on two datasets conll2003 and ace05; and demonstrate that by adding a word level cnn, useful local properties are extracted that enhance the accuracy of the performance. finally, we compare the performance of our system with competitors and our superiority is reported.
|
|
|
|
|
|
|
|
|
|
|
|
|