|
|
تشخیص هوشمند و خودکار غلطهای تایپی در پایگاهدادههای بزرگ بدون استفاده از لغتنامه
|
|
|
|
|
نویسنده
|
زعفرانی معطر الناز ,فیضی درخشی محمدرضا ,روحانی آزاده
|
منبع
|
مهندسي برق دانشگاه تبريز - 1396 - دوره : 47 - شماره : 1 - صفحه:81 -91
|
چکیده
|
غلطهای تایپی یکی از مشکلات مهم در سیستمهای کامپیوتری و سیستمهای پایگاهدادهای است. وجود غلطهای تایپی در پایگاهدادهها نه تنها از نظر صحت پایگاهداده مشکلساز هستند، بلکه باعث میشوند به هنگام ضرورت نتوان رکورد واردشده را بازیابی کرد. همین امر گاه باعث میشود که کاربر مجدداً همان رکورد را وارد پایگاهداده نماید که منجر به وجود آمدن افزونگی میگردد. روشهای موجود تشخیص غلطها، مبتنی بر لغتنامه هستند. بدین معنی که از یک لغتنامه بزرگ که همه لغات آن صحیح فرض میشوند استفاده میکنند و اگر کلمهای در لغتنامه نباشد بهعنوان غلط تایپی شناخته میشود. تهیه لغتنامهای بزرگ و با دقت بالا بسیار پرهزینه و زمانبر است. بهعلاوه چنین لغتنامهای مختص یک زمینه خاص (مثلاً محیط پزشکی) است و قابلاستفاده و در زمینههای دیگر (مثلاً جامعهشناسی) نیست. در این مقاله روشی ارائه میشود که بدون نیاز به لغتنامه میتواند غلطهای تایپی را تشخیص دهد. روش پیشنهادی با چند معیار مرسوم ارزیابی شده است. نتایج آزمایشها نشاندهنده دقت 93.5 درصدی برای این روش است. علاوهبر دقت بالای روش پیشنهادی، عدمنیاز به لغتنامه یک ویژگی منحصر به فرد برای آن بهشمار میرود.
|
کلیدواژه
|
تشخیص غلطهای تایپی، غلطهای املایی، فازی
|
آدرس
|
دانشگاه آزاد اسلامی واحد تبریز, گروه مهندسی کامپیوتر, ایران, دانشگاه تبریز, دانشکده مهندسی برق و کامپیوتر, گروه مهندسی کامپیوتر, ایران, دانشگاه آزاد اسلامی واحد خسروشاه, گروه مهندسی کامپیوتر, ایران
|
پست الکترونیکی
|
roohany@iaukhosh.ac.ir
|
|
|
|
|
|
|
|
|
The Intelligent and Automatic Detection of Type Errors in Large Databases without using Dictionary
|
|
|
Authors
|
Zafarani-Moattar E. ,Feizi-Derakhshi M. R. ,Roohany A.
|
Abstract
|
Type errors are one of the main problems in computer systems and database systems. Existence of type errors within databases, not only causes accuracy problem for database, but also leads user to reenter the record into database because the entered record could not be found. It results in redundancy. The existing error detection methods are based on dictionary. It means that they use a large dictionary whose all words are assumed true and if a word is not in the dictionary, it is detected as a type error. Providing a large dictionary with high precision is expensive and time consuming. In addition, such a dictionary belongs to a special field (for example, medical environment) and is not applicable in other fields (such as sociology). In this paper, a method is presented that could detect type errors without requiring a dictionary. The proposed method has been evaluated with some common criteria. The experimental results show 93.5 percent precision for this method. In addition to the high precision of the proposed method, not requiring a dictionary is considered as its unique feature.
|
Keywords
|
|
|
|
|
|
|
|
|
|
|
|