|
|
تاثیر کمبود و پراکندگی داده بر اثربخشی نتایج سامانه ژورنالیاب رایسست؛ مطالعه موردی حوزه فنی و مهندسی
|
|
|
|
|
نویسنده
|
ورع نرجس ,میرزابیگی مهدیه ,ستوده هاجر ,فخراحمد مصطفی ,مظفری نیلوفر
|
منبع
|
پژوهشنامه پردازش و مديريت اطلاعات - 1401 - دوره : 37 - شماره : 4 - صفحه:1318 -1293
|
چکیده
|
عوامل متعددی از مجموعه عناصر تشکیلدهنده سامانههای پیشنهاددهنده در تولید و ارائه پیشنهاد دخیل هستند. مطالعه حاضر، با هدف شناخت تاثیر دو چالش کمبود و پراکندگی داده بر اثربخشی نتایج پیشنهادی سامانه ژورنالیاب «رایسست» انجام شده است. بدین منظور، بیش از 15000 مقاله از نشریههای فنی و مهندسی در بازه زمانی 1392 تا 1396 از وبسایت نشریهها گردآوری شد. در مرحله بعد عناصر متنی این مقالهها شامل عنوان، چکیده و واژههای کلیدی استخراج، نرمالسازی و پردازش شد و پایگاه دادهپیکره پژوهش ایجاد گردید. بر اساس تعداد مقالههای گردآوریشده، با استفاده از فرمول «کوکران» تعداد 400 مقاله پایه، که پیش از این در نشریههای مرتبط با موضوع منتشر شده بودند، به روش تصادفی-تناسبی انتخاب شد. عنوان و چکیده این مقالهها، بهمنظور دریافت نشریههای پیشنهادی سامانه، جهت چاپ مقاله در دو مرحله پیش و پس از بهبود دو چالش کمبود و پراکندگی داده بهعنوان پرسمان وارد سامانه شد. سپس، نتایج پیشنهادی در هر مرحله در قالب فایل «اکسل» ذخیره گردید. سرانجام، میزان اثربخشی نتایج سامانه در هر مرحله به روش اعتبارسنجی یکطرفه و بر اساس معیار دقت در k تعیین شد. فراوانی نسبی ردهها نشان داد که در وضعیت موجود، نشریه هدف تنها در 26 درصد از پرسمانها در 3 رتبه نخست پیشنهاد شده است. در راستای بهبود چالش کمبود داده با غنیسازی، نرمالسازی و پردازش دادهها اثربخشی نتایج در 3 رتبه نخست به میزان 15 درصد افزایش یافت. اما همچنان در بیش از 30 درصد پرسمانها، نشریه هدف در رتبه 10 و بالاتر پیشنهاد شده بود. بنابراین، در مرحله بعد، بهمنظور بهبود چالش پراکندگی، دستهبندی موضوعی دادهها انجام و افزایش 30 درصدی اثربخشی نتایج نسبت به مرحله پیشین در 3 رتبه نخست حاصل گردید. بر این اساس، یکی از عواملی که منجر به کاهش اثربخشی نتایج پیشنهادی سامانه ژورنالیاب «رایسست» میشود، کمبود و پراکندگی دادههاست که با غنیسازی پایگاه داده، بهبود فرایند پردازش، و دستهبندی موضوعی دادهها میتوان با این دو چالش به میزان قابل توجهی مقابله کرد و اثربخشی نتایج پیشنهادی سامانه را بهبود بخشید.
|
کلیدواژه
|
اثربخشی، سامانه پیشنهاددهنده نشریه، کمبود داده، پراکندگی داده، سامانه ژورنالیاب رایسست
|
آدرس
|
مرکز منطقهای اطلاعرسانی علوم و فناوری, ایران, دانشگاه شیراز, گروه علم اطلاعات و دانششناسی, ایران, دانشگاه شیراز, گروه علم اطلاعات و دانششناسی, ایران, دانشگاه شیراز, گروه مهندسی و علوم کامپیوتر و فناوری اطلاعات, ایران, مرکز منطقهای اطلاعرسانی علوم و فناوری, ایران
|
پست الکترونیکی
|
mozafari@ricest.ac.ir
|
|
|
|
|
|
|
|
|
The Impact of Data Lack and Data Sparsity on the Effectiveness of the Results of the RICeST Journal Finder Results: A Case Study in the Field of Engineering
|
|
|
Authors
|
Vara Narjes ,Mirzabeigi Mahdieh ,Sotudeh Hajar ,Fakhrahmad Mostafa ,Mozafari Niloofar
|
Abstract
|
Several factors are involved in the production and presentation of recommender systems.The aim of this study was to investigate the effect of the two challenges lack and sparsity of data on the effectiveness of the proposed results of the RICeST Journal Finder. The corpus includes more than 15,000 articles from technical and engineering publications in the period 2013 to 2017, which have been collected from their website. Textual elements of these articles were extracted, normalized and processed, and a research body database was created. Based on the number of collected articles, by using Cochran’s formula, 400 basic articles that previously published in related to the topic of each journal were selected in a randomproportional method. Title and abstract of these articles as a query, in order to receive the system journals suggested, to print the article in two stages of before and after improving the two challenges of lack and sparsity of data in the test corpus. The suggested results in each step were saved in Excel. Finally, the effectiveness of the system results in each stage was determined by Leaveoneout CrossValidation method and based on the accuracy criterion in k. The relative abundance of categories showed that, in the current situation, the target journal was suggested in only 26% of searches in the first 3 ranks. After enriching, normalizing and processing the data and thus improving the lack of data challenge, although 30% of the results were still rated above 10; but the accuracy of the results in the first 3 ranks increased by 15%. Also, after thematically categorizing the data with the aim of improving the sparsity challenge, 30% increase in the accuracy of the system results in the first 3 ranks compared to the previous step was achieved. The results of this study showed that enriching the database, improving the processing process and thematic classification of data in RICeST journal finder can reduce the two challengs lack and sparsity of data and increase the effectiveness of the proposed results of this systems.
|
Keywords
|
Efficiency ,Journal Finder ,Lack of Data ,Data Sparsity ,RICeST Journal Finder
|
|
|
|
|
|
|
|
|
|
|