>
Fa   |   Ar   |   En
   بررسی تنوع الگوهای نگارش فارسی و تاثیر آن بر جامعیت بازیابی اطلاعات (مطالعه موردی : پیکره همشهری)  
   
نویسنده ستوده هاجر ,هنرجویان زهره
منبع كتابداري و اطلاع رساني - 1393 - دوره : 17 - شماره : 2 - صفحه:31 -49
چکیده    در سبک نگارش فارسی، برخی واژه ها را می توان با درج، حذف یا جایگزینی نویسه ای خاص نوشت و به این ترتیب، برای واژه ای واحد دو یا چند الگوی نگارشی متفاوت پدید آورد. این نایکدستی در الگوهای نگارش می‌تواند بر اثربخشی بازیابی اطلاعات فارسی تاثیر منفی داشته باشد. آشکار است که تلاش در جهت لحاظ کردن همه الگوها در الگوریتم‌های بازیابی اطلاعات فارسی، بر پیچیدگی آنها می‌افزاید و کارآیی سامانه‌های بازیابی اطلاعات را کاهش می‌دهد. از این رو، ضروری است با بررسی رفتارهای نگارندگان فارسی، میزان چندگانگی الگوها و تاثیر آن بر بازیابی اطلاعات در عمل و در نتیجه، ضرورت لحاظ کردن آنها در الگوریتم‌های فارسی آشکار گردد. روش پژوهش: در پژوهش حاضر که به روش تحلیل محتوای مفهومی انجام گرفته است، 7 چالش از میان 43 چالش نگارشی که با مرور ادبیات مربوط، شناسایی شده بود انتخاب گردید و پس از محاسبه تنوع و فراوانی رویداد آنها در متون پیکره همشهری، میزان انطباق شیوه نگارش آنها با دستور خط مصوب فرهنگستان زبان و ادب فارسی بررسی شد. یافته‌ها: نتایج پژوهش نشان داد نگارندگان متون پیکره به طور کلی تمایل به حذف یا جایگزینی نویسه‌های چالشی دارند. بنابراین، به نظر می‌رسد دست‌کم درباره هفت چالش مورد بررسی در این پژوهش، با نادیده گرفتن این چالش‌ها در سامانه‌های بازیابی اطلاعات، اثربخشی بازیابی چندان متاثر نمی‌شود. مقدار کلی شاخص«ضریب درگیری» برابر با 0.033 به دست آمد که بیانگر انطباق نداشتن گسترده الگوی نگارشی نگارندگان با دستور خط مصوب فرهنگستان است. از دلایل این امر می‌توان به تمایل نگارندگان به ساده‌نگاری در اثر «اصل کمترین کوشش» و عدم احساس ضرورت رعایت رسم‌الخط مرسوم عربی توصیه شده در دستور خط مصوب فرهنگستان، اشاره کرد.
کلیدواژه بازیابی اطلاعات، نگارش فارسی، چالش، پیکره همشهری
آدرس دانشگاه شیراز, ایران
پست الکترونیکی z.honarjooyan@gmail.com
 
     
   
Authors
  
 
 

Copyright 2023
Islamic World Science Citation Center
All Rights Reserved