برچسبگذاری خودکار فراگفتمان موضعگیری مقالات علمی فارسی با استفاده از یادگیری عمیق
|
|
|
|
|
نویسنده
|
قیومی مسعود ,عبدالهپور محمدمهدی
|
منبع
|
پژوهش هاي زبان شناسي تطبيقي - 1401 - دوره : 12 - شماره : 23 - صفحه:55 -75
|
چکیده
|
در تحلیل فراگفتمانی روابط بین نویسنده، خواننده و خود متن بررسی میشود. هایلند (2005) شیوهای از تحلیل را مطرح کرد که نوعی رابطه تعاملی بین این سه رکن متن ایجاد میکند. روابط فراگفتمان تعاملی به دو دسته موضعگیری و مشارکتی تقسیم میشود. فراگفتمان موضعگیری با پنج نوع نشانگر نشانهگذاری میشود. هدف از انجام این پژوهش این است که به مدل رایانشی دست یافت تا بهصورت خودکار امکان برچسبگذاری فراگفتمانی نشانگرها، خواه واژهها یا عبارات، میسر گردد. برای رسیدن به هدف، ابتدا بهواسطه خزش پیکرهای از چکیده مقالات موجود در پرتال جامع علوم انسانی بهدست آمد و کار نشانهگذاری فراگفتمان موضعگیری چکیدهها که متعلق به 16 حوزه علوم انسانی بود بر اساس نظر فراگفتمان تعاملی هایلند (2005) نشانهگذاری شد. در این فرایند 50 چکیده برای هر حوزه نشانهگذاری شد. از این داده برای آموزش مدل پردازشی استفاده شد. در این پژوهش، یک مدل با استفاده از بازنمایی معنایی واژهها در فضای برداری ساخته شده توسط ورد2وک تهیه شده است و در دو مدل دیگر از بازنمایی معنایی مبتنی بر برت بهنامها پارسبرت و ایکس.ال.ام-روبرتا استفاده شده است تا بافتهای جایگاهی متنوعتری از واژهها در بردارها لحاظ گردد. مدلها در سطح واژه یا عبارت کار برچسبگذاری را انجام داده است. براساس نتایج عملی بهدستآمده، مدل مبتنیبر بازنمایی برت با تفاوت معناداری بهتر از مدل مبتنی بر بازنمایی ورد2وک عمل نمود. از میان دو مدل مبتنی بر بازنمایی برت، در مجموع برچسبگذاری در سطح واژه و عبارت، مدل ایکس.ال.ام-روبرتا با 82.82 درصد امتیاز f در سطح واژه و 51.81 درصد امتیاز f در سطح عبارت کارایی بهتری نسبتبه مدل پارسبرت بهدست آورد.
|
کلیدواژه
|
فراگفتمان موضعگیری، بازنمایی معنایی، ورد2وک، برت، نشانهگذاری پیکره زبانی
|
آدرس
|
پژوهشگاه علوم انسانی و مطالعات فرهنگی, ایران, دانشگاه صنعتی امیرکبیر, دانشکده مهندسیکامپیوتر, ایران
|
پست الکترونیکی
|
mabdollahpour@aut.ac.ir
|
|
|
|
|