|
|
کاربرد و تعدیل قانون زیف و الگوی آماری زو در بازشناسی واژه های بازدارنده زبان فارسی با استفاده از خوشه زبانی مقالات علمی- پژوهشی رشته کتابداری و اطلاع رسانی
|
|
|
|
|
نویسنده
|
هاشم زاده محمد جواد ,نخعی زینب ,مرادی مقدم حسین
|
منبع
|
پژوهشنامه كتابداري و اطلاع رساني - 1392 - دوره : 3 - شماره : 2 - صفحه:191 -208
|
چکیده
|
هدف: شناسایی و استخراج سیاهه هایی نظام مند از واژه های بازدارنده به منظور استفاده در نمایه سازی خودکار متن های فارسی رشته کتابداری و اطلاع رسانی روش: روش تحلیل محتوا است. جامعه پژوهش، 56 مقاله بودند که 20 مقاله با روش نمونه گیری تصادفی ساده انتخاب شدند. یافته ها: از مجموع 15557 واژه موجود در متن مقالات، مطابق با الگوی زو، قبل از تعدیل واژه ها، 1368 و بعد از تعدیل، 468 واژه؛ مطابق قانون زیف نیز قبل از تعدیل، 217 و بعد از تعدیل، 607 واژه به عنوان واژه بازدارنده شناخته شدند. هم چنین از مجموع 1989 واژه موجود در چکیده مقالات، مطابق با الگوی زو قبل از تعدیل واژه ها، 148 و بعد از تعدیل، 173 واژه و بر اساس قانون زیف، قبل از تعدیل60 و بعد از تعدیل، 186 واژه به عنوان واژه بازدارنده استخراج شدند. در هر دو روش رابطه مستقیمی بین بسامد واژه ها و احتمال بازدارنده بودن آن ها مشاهده شد. بالاترین درصد واژه های بازدارنده (44/39 درصد) بدون احتساب بسامد، در متن مقالات و با کاربرد الگوی آماری زو به دست آمد. نتایج این پژوهش به افزایش کارایی، کاهش حجم فایل درونداد و صرفه جویی در زمان و هزینه ذخیره و بازیابی اطلاعات منجر می شود.
|
کلیدواژه
|
واژه های بازدارنده ,بسامد واژگانی ,قانون زیف ,نمایه سازی خودکار ,الگوی آماری زو ,Stop words ,Word frequency ,Zip flaw ,Automatic indexing ,Zou Statistical Model
|
آدرس
|
دانشگاه بیرجند, استادیار گروه کتابداری و اطلاع رسانی دانشگاه بیرجند, ایران, دانشگاه بیرجند, کارشناس ارشد کتابداری و اطلاع رسانی دانشگاه بیرجند, ایران, دانشگاه بیرجند, مدرس دانشگاه بیرجند, ایران
|
پست الکترونیکی
|
moradymoghadam@gmail.com
|
|
|
|
|
|
|
|
|
|
|
|
Authors
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|