|
|
حل جدول کلمات متقاطع فارسی با تکنیکهای پردازش زبان طبیعی
|
|
|
|
|
نویسنده
|
پاکزادیان محمدرضا ,شمسفرد مهرنوش
|
منبع
|
نهمين كنفرانس بين المللي وب پژوهي - 1402 - دوره : 9 - نهمین کنفرانس بین المللی وب پژوهی - کد همایش: 02221-97364 - صفحه:0 -0
|
چکیده
|
در این مقاله، به معرفی راهکارهایی برای حل جدول کلمات متقاطع توسط ماشین با استفاده از تکنیکهای پردازش زبان طبیعی میپردازیم. این کار به دو زیروظیفه یافتن کلمات محتمل برای هر شرح جدول و سپس انتخاب کلمه هدف و جایگذاری در جدول تقسیم می شود. زیروظیفه اول که به یافتن کلمه از روی توصیف آن اختصاص دارد دارای کاربردهای متعدد دیگر نیز هست. به این منظور از ترکیبی از روشهای مختلف شامل جستجو و شباهتیابی معنایی روی دادگان جداول حل شده قبلی، جستجو در فرهنگ لغات و دانشنامه ویکیپدیا، استفاده از مدل زبانی ماسک شده و یافتن کلمات مرتبط در فارسنت و ابزار فارسییار استفاده نمودیم. نتایج نشان میدهند ترکیب این روشها نسبت به اجرای تک تک آنها نتیجه بهتری (فراخوانی 82%) در برداشته است. در زیروظیفه بعد لیست پاسخهای محتمل را به یک الگوریتم جستجو با ارضاء قیود میدهیم تا با درنظر گرفتن قیود جدول از میان پاسخها، پاسخ درستی که میتواند در جدول قرار گیرد را انتخاب کرده و خانههای خالی را به بهترین شکل پر کند و جدول را حل کند. ارزیابی کل نشانگر دقت 80.22٪ و فراخوانی 68.86٪ در حل جدول کلمات متقاطع است.
|
کلیدواژه
|
حل جدول کلمات متقاطع، جستجو با ارضاء قیود، پردازش زبان طبیعی، فهم تعریف
|
آدرس
|
, iran, , iran
|
پست الکترونیکی
|
m-shams@sbu.ac.ir
|
|
|
|
|
|
|
|
|
solving persian crosswords with natural language processing techniques
|
|
|
Authors
|
|
Abstract
|
in this article, we introduce solutions for solving crossword puzzles by machine using natural language processing techniques. this task is divided into two subtasks of finding possible answers for each table description and then selecting the target word and placing it in the table. the first subtask, which is dedicated to finding the word from its description, has many other uses as in text generation and paraphrasing. for this purpose, we used a combination of different methods, including searching and finding semantic similarities on the data of previously solved tables, searching in dictionary and wikipedia articles, using a masked language model, and finding related words in farsnet and the farsiyar tool. the results show that the combination of these methods has a better result (82% recall) compared to their individual implementation. in the next subtask, we give the list of possible answers to a constraint-satisfaction search algorithm to choose the correct answer that can be placed in the table, taking into account the constraints of the table, and fill the empty cells in the best way and solve the crossword. the overall evaluation shows 80.22% precision and 68.86% recall in solving the crossword puzzle.
|
Keywords
|
crossword solving ,constraint satisfaction problem ,natural language processing ,description understanding
|
|
|
|
|
|
|
|
|
|
|