>
Fa   |   Ar   |   En
   معرفی و آزمون پیکره علیت percause برای شناسایی روابط علّی فارسی  
   
نویسنده رحیمی زینب ,شمس فرد مهرنوش
منبع پژوهشنامه پردازش و مديريت اطلاعات - 1401 - دوره : 38 - شماره : 2 - صفحه:607 -638
چکیده    شناسایی روابط علّی و تعیین مرز عناصر علّی در متن از جمله مسائل چالش برانگیز در پردازش زبان طبیعی، به ویژه در زبان های کم منبع مانند زبان فارسی است. در این پژوهش در راستای آموزش سیستمی برای شناسایی روابط علّی و مرز عناصر آن، یک پیکره‌ علّیت برچسب خورده‌ انسانی برای زبان فارسی معرفی می شود. این مجموعه شامل 4446 جمله مستخرج از پیکره‌ «بیجن خان» و متن یک سری کتاب) و 5128 رابطه‌ علّی است و در صورت وجود، سه برچسب علت، معلول، و نشانه‌ علّی برای هر رابطه مشخص شده است. در این پژوهش از پیکره برای آموزش سیستمی به منظور تشخیص مرزهای عناصر علّی استفاده شده است. همچنین، یک بستر آزمون شناسایی علّیت با سه روش یادگیری ماشین و دو سیستم یادگیری عمیق مبتنی بر این پیکره ارائه شده است. ارزیابی های عملکرد نشان می دهد که بهترین نتیجه‌ کلی از طریق طبقه بندی کننده‌ crf به دست می آید که معیار f برابر 76 درصد را ارائه می کند. افزون بر این، بهترین صحت (91/4 درصد) در روش یادگیری عمیق bilstm-crf به دست آمده است. به نظر می رسد که وجود crf به دلیل مدل سازی بافتار به بهبود دقت سیستم منجر می شود.
کلیدواژه percause، شناسایی عبارات علّی، crf، یادگیری عمیق
آدرس دانشگاه شهید بهشتی, آزمایشگاه پردازش زبان طبیعی, ایران, دانشگاه شهید بهشتی, آزمایشگاه پردازش زبان طبیعی, ایران
پست الکترونیکی shams@sepehrs.com
 
   persian causality corpus (percause) and the causality detection benchmark  
   
Authors rahimi zeinab ,shamsfard mehrnoush
Abstract    recognizing causal elements and causal relations in the text is among the challenging issues in natural language processing (nlp), specifically in low-resource languages such as persian. in this research, we prepare a causality human-annotated corpus for the persian language. this corpus consists of 4446 sentences and 5128 causal relations. three labels of cause, effect, and causal mark are specified to each relation, if possible. we used this corpus to train a system for detecting causal elements’ boundaries.also, we present a causality detection benchmark for three machine-learning methods and two deep learning systems based on this corpus. performance evaluations indicate that our best total result is obtained through the crf classifier, which provides an f-measure of 0.76. in addition, the best accuracy (91.4%) is obtained through the bilstm-crf deep learning method
Keywords percause ,crf
 
 

Copyright 2023
Islamic World Science Citation Center
All Rights Reserved