>
Fa   |   Ar   |   En
   تحلیل توزیع و تمرکز کلیدواژه‌های پارساها: میزان تطابق با توصیفگرها، عنوان، و چکیده  
   
نویسنده خطیر اشکان ,گنجه فر سهیل
منبع پژوهشنامه پردازش و مديريت اطلاعات - 1397 - دوره : 34 - شماره : 1 - صفحه:411 -428
چکیده    نمایه ها و چکیده های یک متن خلاصه ای از متن را در اختیار خواننده قرار می دهند. پس، می توان از آن ها برای درک سریع و بازیابی سند استفاده کرد. از آنجا که بخش عمده ای از فعالیت های علمی فارسی در کشور ایران را پارسا ها تشکیل می دهند، در این پژوهش نمایه سازی پارسا ها از دو دیدگاه نویسنده پارسا و نمایه ساز حرفه ای مورد بررسی قرار خواهد گرفت. سپس، این نمایه ها با عنوان پارساها مورد بررسی قرار می گیرند تا میزان انطباق با کلیدواژه های عنوانی به دست آید. از سوی دیگر، با بررسی کلی مجموعه ای از نمایه ها و چکیده ها علاوه بر قابلیت بهبود در بازیابی اطلاعات برای محقق، حوزه فعالیتی که بیشتر اسناد بر روی آن تمرکز کرده اند، مشخص می شود. علاوه بر آن، در این پژوهش وجود نمایه ها و توزیع آن ها در چکیده بررسی می شود. از توزیع کلیدواژه ها در چکیده می توان در استخراج خودکار کلیدواژه ها از چکیده پارساها در کارهای آتی استفاده نمود. این پژوهش بر روی پارسا های موجود در پایگاه داده «پژوهشگاه علوم و فناوری اطلاعات ایران» که منبع گردآوری پارسا های فارسی است، انجام شده است. روش پژوهش به این صورت است که بعد از گردآوری داده ها، پارسا هایی که اطلاعات کافی ندارند، پالایه شده و بقیه «پارسا ها» توسط برنامه ای که برای پردازش متن چکیده و نمایه های پارسا ها نوشته ایم، مورد تحلیل قرار خواهند گرفت. سپس، اطلاعات به دست آمده با استفاده از آمار توصیفی شرح داده خواهد شد. بررسی انجام شده در این پژوهش نشان داده است که عموماً نمایه های انتخاب شده (بیش از 60 درصد) توسط نویسنده و نمایه ساز حرفه ای از 40 درصد ابتدایی چکیده انتخاب شده اند. دیگر تحلیل های آماری این پژوهش نشان می دهند که میزان انطباق بین توصیفگرها و کلیدواژه ها 8 درصد است. این اختلاف نشان دهنده میزان تفاوت نظر زیاد بین نویسندگان پارسا ها و نمایه سازان است. با بهره گیری از این اختلاف و با تجمیع کلمات و غنی کردن کلیدواژه های سیستم بازیابی اطلاعات می توان در بهبود بازیابی اطلاعات نیز استفاده کرد.
کلیدواژه نمایه‌سازی، کلیدواژه، توصیفگر، توزیع کلیدواژه، تمرکز فعالیت پژوهشی
آدرس پژوهشگاه علوم و فناوری اطلاعات ایران(ایرانداک), ایران, پژوهشگاه علوم و فناوری اطلاعات ایران (ایرانداک), ایران. دانشگاه بوعلی سینا, دانشکده مهندسی, گروه برق, ایران
پست الکترونیکی s_ganjefar@basu.ac.ir
 
   The Analysis of the Distribution and Focus of Keywords in Theses and Dissertations and Compliance with Descriptors, Title, and Abstract  
   
Authors Khatir Ashkan ,Ganjefar Soheil
  
 
 

Copyright 2023
Islamic World Science Citation Center
All Rights Reserved