|
|
ویرایشگر متن شریف: سامانۀ ویرایش و خطایابی املایی زبان فارسی
|
|
|
|
|
نویسنده
|
وزیرنژاد بهرام ,سلطان زاده فاطمه ,مهدوی مزده محسن ,مرادی مهدی
|
منبع
|
پردازش علائم و داده ها - 1394 - دوره : 12 - شماره : 4 - صفحه:43 -52
|
چکیده
|
در مقالۀ حاضر سامانه ای هوشمند جهت ویرایش و خطایابی املایی متون فارسی معرفی شده است. هدف از طراحی و ایجاد این سامانه، ویرایش متون فارسی برای کاربردهای پردازش زبان طبیعی است. این سامانه بر مبنای یک رویکرد مهندسی قابل توسعه، از سه زیرسامانه تشکیل شده است: ویرایش گر متن فارسی معیار، خطایاب املایی خودکار زبان فارسی و ستاک یاب واژگان زبان فارسی. این سه بخش با یکدیگر در تعاملند؛ بدین شکل که ابتدا ستاک واژه های متن شناسایی می شود و در صورت عدم وجود ستاک در فهرست واژه های زبان، واژۀ مذکور به عنوان واژه ای نادرست شناسایی خواهد شد و سپس خطایاب خودکار فهرستی از واژه های جایگزین را پیشنهاد خواهد کرد. در زیرسامانۀ ویرایش گر، متن موجود ویرایش شده و متنی یکپارچه که منطبق بر معیارهای مصوب فرهنگستان زبان و ادب فارسی است، به کاربر ارائه خواهد شد. نتایج ارزیابی نشان دهندۀ دقتی بسیار خوب در حدود 95% در ستاک یابی کلمات، 92% در ویرایش و 96% در خطایابی املایی زبان فارسی است.
|
کلیدواژه
|
پردازش زبان طبیعی، خطایاب املایی خودکار، ویرایشگر متن فارسی معیار، ستاکیاب
|
آدرس
|
دانشگاه صنعتی شریف, ایران, دانشگاه صنعتی شریف, ایران, دانشگاه آریزونا, آمریکا, دانشگاه صنعتی شریف, ایران
|
|
|
|
|
|
|
|
|
|
|
Sharif Text Editor: A Persian Editor and Spell Checker System
|
|
|
Authors
|
|
Abstract
|
In this paper, we will introduce an intelligent system to edit and spell check Persian texts. The goal is editing and preprocessing Persian texts for natural language processing tasks. This system is based on an expandable and engineering approach and is composed of three subsystems: Persian text editor, spell checker and stemmer. These parts interact with each other to edit texts. To do this, the stemmer subsystem process each word in the text if the subsystem could not find a stem in the lexicon, the word will be recognized as an incorrect word. Then, the spell checker provides a list of suggestions to correct the wrong word. Subsequently, the editor subsystem edits the text based on the standards of the Academy of Persian Language and Literature. Our evaluation shows nearly 92%, 95% and 96% precision numbers for editor, stemmer and spell checker subsystems, respectively.
|
Keywords
|
Key words: Natural Language Processing ,automatic spell checking ,text editor ,stemmer
|
|
|
|
|
|
|
|
|
|
|