بررسی تنوع الگوهای نگارش فارسی و تاثیر آن بر جامعیت بازیابی اطلاعات (مطالعه موردی : پیکره همشهری)
|
|
|
|
|
نویسنده
|
ستوده هاجر ,هنرجویان زهره
|
منبع
|
كتابداري و اطلاع رساني - 1393 - دوره : 17 - شماره : 2 - صفحه:31 -49
|
چکیده
|
در سبک نگارش فارسی، برخی واژه ها را می توان با درج، حذف یا جایگزینی نویسه ای خاص نوشت و به این ترتیب، برای واژه ای واحد دو یا چند الگوی نگارشی متفاوت پدید آورد. این نایکدستی در الگوهای نگارش میتواند بر اثربخشی بازیابی اطلاعات فارسی تاثیر منفی داشته باشد. آشکار است که تلاش در جهت لحاظ کردن همه الگوها در الگوریتمهای بازیابی اطلاعات فارسی، بر پیچیدگی آنها میافزاید و کارآیی سامانههای بازیابی اطلاعات را کاهش میدهد. از این رو، ضروری است با بررسی رفتارهای نگارندگان فارسی، میزان چندگانگی الگوها و تاثیر آن بر بازیابی اطلاعات در عمل و در نتیجه، ضرورت لحاظ کردن آنها در الگوریتمهای فارسی آشکار گردد. روش پژوهش: در پژوهش حاضر که به روش تحلیل محتوای مفهومی انجام گرفته است، 7 چالش از میان 43 چالش نگارشی که با مرور ادبیات مربوط، شناسایی شده بود انتخاب گردید و پس از محاسبه تنوع و فراوانی رویداد آنها در متون پیکره همشهری، میزان انطباق شیوه نگارش آنها با دستور خط مصوب فرهنگستان زبان و ادب فارسی بررسی شد. یافتهها: نتایج پژوهش نشان داد نگارندگان متون پیکره به طور کلی تمایل به حذف یا جایگزینی نویسههای چالشی دارند. بنابراین، به نظر میرسد دستکم درباره هفت چالش مورد بررسی در این پژوهش، با نادیده گرفتن این چالشها در سامانههای بازیابی اطلاعات، اثربخشی بازیابی چندان متاثر نمیشود. مقدار کلی شاخص«ضریب درگیری» برابر با 0.033 به دست آمد که بیانگر انطباق نداشتن گسترده الگوی نگارشی نگارندگان با دستور خط مصوب فرهنگستان است. از دلایل این امر میتوان به تمایل نگارندگان به سادهنگاری در اثر «اصل کمترین کوشش» و عدم احساس ضرورت رعایت رسمالخط مرسوم عربی توصیه شده در دستور خط مصوب فرهنگستان، اشاره کرد.
|
کلیدواژه
|
بازیابی اطلاعات، نگارش فارسی، چالش، پیکره همشهری
|
آدرس
|
دانشگاه شیراز, ایران
|
پست الکترونیکی
|
z.honarjooyan@gmail.com
|
|
|
|
|