|
|
تحلیل سنجههای استنادمحور برای تعیین میزان ربط مقالهها
|
|
|
|
|
نویسنده
|
گلتاجی مرضیه ,عباس پور جواد ,جوکار عبدالرسول ,فخراحمد مصطفی ,نیک سرشت علیرضا
|
منبع
|
مطالعات كتابداري و سازماندهي اطلاعات - 1400 - دوره : 32 - شماره : 3 - صفحه:56 -76
|
چکیده
|
هدف: شناخت توانایی سنجههای استنادمحور (هماستنادی، زوج کتابشناختی، امسلر، پیجرنک و هیتس(اعتبار و کانون)) برای تعیین میزان ربط مقالهها با یکدیگر. روش: پژوهش حاضر از نظر هدف، کاربردی و از لحاظ شیوه گردآوری دادهها، پژوهشی توصیفی از نوع همبستگی است. جامعه آماری، مجموعه مقالات موجود در زیرمجموعه دسترسی آزاد پابمد سنترال مجموعه آزمون سایترک بود که بر اساس سه سنجه هماستنادی، زوج کتابشناختی و امسلر با سایر مقالات رابطه استنادی داشتند. از میان 26262 مقاله، 30 مقاله بهعنوان مقالات پایه انتخاب شد و مقالات مرتبط با هر یک از آنها بر اساس سنجه ربط مش بازیابی گردید؛ هر یک از سنجههای استنادمحور متغیر مستقل و سنجه ربط مش متغیر وابسته بود. با استفاده از نرمافزار شبیه ساز ومپسرور و پی.اچ.پی.مایادمین یک پایگاه مای.اس.کیو.ال ایجاد شد؛ سپس، با مطالعه کلیه کدهای مورد نیاز از بسته کد منبع سایترک، کدهای لازم با اعمال تغییرات ضروری، اجرا و نتایج حاصل در پایگاه مای.اس.کیو.ال وارد شد. با نوشتن پرسوجو به زبان اس.کیو.ال، شبکه استنادی مجموعه بهصورت کامل استخراج شد سپس با کدنویسی به زبان پایتون اعداد مربوط به پیجرنک و هیتس (اعتبار و کانون) بهصورت جداگانه محاسبه گردید.یافتهها: نتایج نشان داد تمامی شش سنجه در سطح یک صدم همبستگی معنادار و مثبت با میزان ربط مقالهها داشت؛ بهعبارت دیگر، با افزایش مقادیر هریک از سنجهها، درجه ربط مقالهها نیز افزایش یافت. بیشترین میزان همبستگی مربوط به سنجه امسلر و پس از آن، زوج کتابشناختی بود. پس از سنجههای امسلر و زوج کتابشناختی، بیشترین همبستگی میان متغیر هیتس(اعتبار) با ربط مقالهها بود. متغیر پیجرنک در مرتبه چهارم قرار داشت؛ در نهایت، کمترین میزان همبستگی با ربط مقالهها، مربوط به سنجههای هماستنادی و هیتس( کانون) بود؛ بنابراین، از میان سنجههای استنادی بررسیشده در این پژوهش، سنجههای امسلر، زوج کتابشناختی، هیتس(اعتبار) و پیجرنک بیش از سایر سنجهها از پتانسیل لازم برای تعیین میزان ربط مقالهها برخوردار بودند. نتیجهگیری: بر اساس یافتههای پژوهش میتوان گفت سنجههای استنادمحور مطالعهشده قادرند درجه ربط مقالهها را برآورد کنند و در بافتارهای مختلف بازیابی اطلاعات شامل موتورهای جستوجو، پایگاههای اطلاعاتی و استنادی، سامانههای پیشنهاددهنده و حتی کتابخانههای دیجیتالی برای دسترسی به مقالات مرتبط، پیشنهاد مقالات مشابه و رتبهبندی نتایج بازیابی کاربرد داشته باشند؛ همچنین، لازم است به سنجه امسلر که نسبت به دو سنجه سنتی هماستنادی و زوج کتابشناختی، در سامانههای اطلاعاتی کمتر استفاده شدهاست، بیش از پیش توجه شود؛ از طرفی، علیرغم اینکه سنجه هماستنادی در برخی از پایگاهها و سامانههای بازیابی اطلاعات بین المللی( مانند ساینس دایرکت و سایت سیر) برای بازیابی مدارک مرتبط و پیشنهاد مدارک مشابه استفاده میشود در مقایسه با سایر سنجهها از کارایی کمتری برخودار است.
|
کلیدواژه
|
ربط مقالهها، هماستنادی، زوج کتابشناختی، امسلر، پیجرنک، هیتس، سنجههای استنادمحور
|
آدرس
|
دانشگاه شیراز واحد بین الملل, ایران, دانشگاه شیراز, دانشکده علوم تربیتی و روانشناسی, گروه علم اطلاعات و دانششناسی, ایران, دانشگاه شیراز, دانشکده علوم تربیتی و روانشناسی, گروه علم اطلاعات و دانششناسی, ایران, دانشگاه شیراز, دانشکده مهندسی برق و کامپیوتر, گروه علم اطلاعات و دانش شناسی, ایران, دانشگاه شیراز, دانشکده علوم تربیتی و روانشناسی, گروه علم اطلاعات و دانششناسی, ایران
|
پست الکترونیکی
|
nikseresht@gmail.com
|
|
|
|
|
|
|
|
|
Analysis of Citationbased Indicators to Determine the Relevance of Articles
|
|
|
Authors
|
Goltaji M. ,Abbaspour J. ,Jowkar A. ,Fakhrahmad S.M. ,Nikseresht A.
|
Abstract
|
Purpose: The present study aimed to investigate the potential of citationbased indicators (CoCitation, Bibliographic Coupling, Amsler, PageRank, HITS) to determine the relevance of articles. Method: This is applied research with correlational approach. The population consisted of 26,262 articles in the PubMed Central open access subset of the CITREC, which had citation relationship with other articles based on all three traditional citationbased indicators (CoCitation, Bibliographic coupling, Amsler). From among the citations in the research population, 30 were selected as basic ones, and the fulltext of them were retrieved based on the mesh similarity. Then the similarities among the retrieved documents were extracted based on citationbased indicators. Each of the citationbased metrics was considered as independent variable and the mesh similarity as dependent variable. A MySQL database was created using WampServer simulation software and PHP My Admin. Then, using online demo of the CITREC test collection, an output was prepared. By entering the output into the MySQL database which contains the research data set, the main structure of its tables was created. Finally, by studying all the required codes from the CITREC source code package, we attempted to enter the required codes by applying necessary changes. The results were entered in the created MySQL database. By writing a query in SQL language, the set citation network was completely extracted and stored in a Commaseparated values (CSV) file. Then, a program was written in Python that could open and process this large file and calculate PageRank and HITS numbers (authority and Hub). Findings: The results showed that all six measures studied had a significant and positive correlation with the relevance of articles. In other words, with increasing the values of each measure, the degree of relevance of the articles also increased. The highest correlation with the relevance of the articles belonged to the Amsler measure, followed by the Bibliographic Coupling. After Amsler and Bibliographic Coupling, the highest correlation was observed in the HITS(Authority) variable, and the PageRank variable was in the fourth place; Finally, the lowest correlation with the relevance of the articles was related to the CoCitation and the HITS (Hub). Therefore, among the known Citation based measure studied here, Amsler, Bibliographic Coupling, HITS(Authority) and PageRank metrics, respectively, had more potential to determine the relevance of articles rather than others. Conclusion: Based on the findings, it can be concluded that the citationbased metrics studied are able to estimate the degree of relevance of articles. Therefore, they can be used in various information retrieval platforms, including search engines, citation based databases, recommender systems, and even digital libraries to access articles, suggest similar articles, and rank retrieved results; Also, the Amsler measure as the less used in information retrieval systems than the two traditional Measure (Co Citations and Bibliographic Coupling) needs to be considered more than ever. On the other hand, despite the fact that Co Citations measure is used in some international information retrieval databases (such as Science Direct and CiteSeer) to retrieve relevant documents and suggest similar documents, it is less efficient than other metrics.
|
Keywords
|
|
|
|
|
|
|
|
|
|
|
|