کاربست انواع جانمایی کلمات پیش آموزش داده شده در مدل های یادگیری عمیق برای تولید عنوان از متون فارسی
|
|
|
|
|
نویسنده
|
شناسا محمد ابراهیم ,مینایی بیدگلی بهروز
|
منبع
|
مهندسي برق و مهندسي كامپيوتر ايران - 1403 - دوره : 22 - شماره : 1 - صفحه:30 -38
|
چکیده
|
با پیدایش روش های یادگیری عمیق، مدل های دنباله به دنباله با هدف ترجمه ماشینی یک جمله مبدا به یک جمله مقصد ارائه شدند و از همین ایده برای ترجمه یا تبدیل یک متن به شکل خلاصهشده آن استفاده گردیده است. خلاصههایی که به این روش تولید میشوند از نظر ساختاری خواناتر بوده و معمولاً معنای کاملی را به خواننده منتقل میکنند. در چنین ساختارهایی برای بازنمایی معنایی واژهها از بردارهای جانمایی کلمات استفاده میشود که در آن، وزن هر کلمه با توجه به کلمات مجاور آن از یک پیکره بزرگ آموزش داده میشود. در حالت کلی وزن این بردارها با انتخاب یک پنجره مجاورت برای هر کلمه بهدست میآید؛ اما در مدلهای زبانی بافتاری مانند برت برای محاسبه وزن این کلمات از مبدلهای چندلایه استفاده میشود که به تمامی کلمات موجود در متن توجه میکنند. تاکنون مقالات متعددی نشان دادهاند که مدلهای زبانی بافتاری بهدلیل قابلیت ریزتنظیم وزنها برای انجام یک وظیفه پردازش زبان طبیعی خاص، موفقتر از سایر روشهای جانمایی کلمات عمل میکنند؛ اما بررسی عملکرد وزن اولیه این مدلها برای کاربست در تولید عنوان در زبان فارسی مورد توجه قرار نگرفته است.در این مقاله به بررسی رفتار جانمایی کلمات بهصورت پیشآموزشدادهشده و بدون ریزتنظیم آنها در تولید عنوان از متون فارسی میپردازیم. برای یادگیری مدل از «علمنت» که یک پیکره فارسی شامل حدود 350 هزار جفت چکیده و عنوان مقالات علمی میباشد، استفاده شده است. نتایج نشان میدهند استفاده از مدل برت حتی بدون ریزتنظیم وزنهای آن در بهبود کیفیت عناوین فارسی تولیدشده تاثیرگذار بوده و معیار 1-rouge را در فارسی به 42% میرساند که بهتر از سایر مدلهای جانمایی است.
|
کلیدواژه
|
یادگیری عمیق، مدل دنباله به دنباله مبتنی بر برت، خلاصه سازی چکیدهای، تولید عنوان، دادگان مقالات فارسی
|
آدرس
|
دانشگاه آزاد اسلامی واحد علوم و تحقیقات تهران, دانشکده برق و کامپیوتر, ایران, دانشگاه علم و صنعت ایران, دانشکده مهندسی کامپیوتر, ایران
|
پست الکترونیکی
|
b_minaei@iust.ac.ir
|
|
|
|
|