برچسب‌گذاری خودکار فراگفتمان موضع‌گیری مقالات علمی فارسی با استفاده از یادگیری عمیق

Fa | Ar | En

برچسب‌گذاری خودکار فراگفتمان موضع‌گیری مقالات علمی فارسی با استفاده از یادگیری عمیق


نویسنده	قیومی مسعود ,عبداله‌پور محمدمهدی
منبع	پژوهش هاي زبان شناسي تطبيقي - 1401 - دوره : 12 - شماره : 23 - صفحه:55 -75
چکیده	در تحلیل فراگفتمانی روابط بین نویسنده، خواننده و خود متن بررسی می‌شود. هایلند (2005) شیوه‌ای از تحلیل را مطرح کرد که نوعی رابطه تعاملی بین این سه رکن متن ایجاد می‌کند. روابط فراگفتمان تعاملی به دو دسته موضع‌گیری و مشارکتی تقسیم می‌شود. فراگفتمان موضع‌گیری با پنج نوع نشانگر نشانه‌گذاری می‌شود. هدف از انجام این پژوهش این است که به مدل رایانشی دست یافت تا به‌صورت خودکار امکان برچسب‌گذاری فراگفتمانی نشانگرها، خواه واژه‌ها یا عبارات، میسر گردد. برای رسیدن به هدف، ابتدا به‌واسطه خزش پیکره‌ای از چکیده مقالات موجود در پرتال جامع علوم انسانی به‌دست آمد و کار نشانه‌گذاری فراگفتمان موضع‌گیری چکیده‌ها که متعلق به 16 حوزه علوم انسانی بود بر اساس نظر فراگفتمان تعاملی هایلند (2005) نشانه‌گذاری شد. در این فرایند 50 چکیده برای هر حوزه نشانه‌گذاری شد. از این داده برای آموزش مدل پردازشی استفاده شد. در این پژوهش، یک مدل با استفاده از بازنمایی معنایی واژه‌ها در فضای برداری ساخته ‌شده توسط ورد2وک تهیه شده ‌است و در دو مدل دیگر از بازنمایی معنایی مبتنی‌ بر برت به‌نام‌ها پارس‌برت و ایکس.ال.ام-روبرتا استفاده شده ‌است تا بافت‌های جایگاهی متنوع‌تری از واژه‌ها در بردارها لحاظ گردد. مدل‌ها در سطح واژه یا عبارت کار برچسب‌گذاری را انجام داده ‌است. براساس نتایج عملی به‌دست‌آمده، مدل مبتنی‌بر بازنمایی برت با تفاوت معناداری بهتر از مدل مبتنی ‌بر بازنمایی ورد2وک عمل نمود. از میان دو مدل مبتنی ‌بر بازنمایی برت، در مجموع برچسب‌گذاری در سطح واژه و عبارت، مدل ایکس.ال.ام-روبرتا با 82.82 درصد امتیاز f در سطح واژه و 51.81 درصد امتیاز f در سطح عبارت کارایی بهتری نسبت‌به مدل پارس‌برت به‌دست آورد.
کلیدواژه	فراگفتمان موضع‌گیری، بازنمایی معنایی، ورد2وک، برت، نشانه‌گذاری پیکره زبانی
آدرس	پژوهشگاه علوم انسانی و مطالعات فرهنگی, ایران, دانشگاه صنعتی امیرکبیر, دانشکده مهندسی‌کامپیوتر, ایران
پست الکترونیکی	mabdollahpour@aut.ac.ir



Authors