>
Fa   |   Ar   |   En
   تاثیر برچسب‌گذاری معنایی در رفع ابهام هم‌نویسه‌های تخصصی از نظر ریزش کاذب در بازیابی متون علمی  
   
نویسنده رضایی دینانی مینا ,کربلا آقایی کامران معصومه ,میرزاییان وحیدرضا
منبع مطالعات كتابداري و سازماندهي اطلاعات - 1401 - دوره : 33 - شماره : 1 - صفحه:107 -124
چکیده    هدف: مسئله اصلی در بازیابی موثر و کاربرمدار هم‌نویسه‌های تخصصی، توسعه فرایندی است که بازیابی اطلاعات نامرتبط را به حداقل برساند (ریزش کاذب= 0). در این مقاله سعی شده با به‌کارگیری رویکرد پیکره‌مدار با استفاده از برچسب‌گذاری معنایی، بازیابی مدارک حاوی هم‌نویسه‌های تخصصی ارزیابی و با راهبردهای موجود (بدون برچسب‌گذاری) مقایسه و یافته‌ها آشکار شود. هدف بهینه‌سازی کارایی نظام بازیابی اطلاعات در کاهش ریزش کاذب بازیابی متون علمی با استفاده از روش رفع ابهام معنایی از هم‌نویسه‌های تخصصی به کمک برچسب‌گذاری معنایی بوده است.روش: پژوهش به‌دلیل ماهیتش به روش ‌تجربی انجام شد. روش تجربی از روش‌های سه‌گانه رفع ابهام معنایی (بانظارت، نیمه‌نظارتی و بدون نظارت) بوده و روشی بانظارت به‌شمار می‌رود. جامعه پژوهش را 442 مقاله علمی در دو گروه گواه و آزمون تشکیل دادند. گروه گواه (پایه) شامل 221 متن کامل مقاله بدون برچسب و گروه تجربی (آزمون) شامل همان 221 مقاله، اما دارای برچسب بود که 46 هم‌نویسۀ تخصصی آن‌ها به روش دستی برچسب‌گذاری شد و در نظام بازیابی پیشنهادی قرارگرفتند و برای بررسی کارآیی برچسب‌ها در رفع ابهام معنایی، از هم‌نویسه‌های تخصصی و کاهش ریزش کاذب آزموده شدند. یافته‌ها: بازیابی در مقاله‌های گروه گواه به‌دلیل ابهام معنایی هم‌نویسه‌های تخصصی، با ریزش کاذب همراه بود؛ درحالی‌که برچسب‌گذاری هم‌نویسه‌های تخصصی در متن کامل مقاله‌های گروه تجربی، تاثیر مستقیمی در کاهش ریزش کاذب داشت. سطح معنی‌داری آزمون رتبه‌های علامت‌دار ویلکاکسون (z=-5/909, p=0/0001) نشان داد که میزان ریزش کاذب نتایج بازیابی بعد از به‌کارگیری پیکره تخصصی برچسب‌گذاری‌شده در نظام بازیابی اطلاعات به‌نسبت قبل، تفاوت معنا‌داری داشت. بررسی رتبه‌های منفی و مثبت نشان داد که میزان ریزش کاذب نتایج بازیابی بعد از به‌کارگیری پیکره تخصصی برچسب‌گذاری‌شده به میزان معنا‌داری کاهش یافته است.نتیجه‌گیری: حد ریزش کاذب در یافته‌های پژوهش، گواه عملکرد قابل قبول برچسب‌گذاری در رفع ابهام معنایی هم‌نویسه‌های تخصصی است. همچنین بیانگر نقش موثر آن در بهینه‌سازی نظام بازیابی اطلاعات برای به‌حداقل‌رساندن ریزش کاذب نتایج است. بنابراین، رویکرد پیکره‌مدار نظام بازیابی اطلاعات، ضمن فراهم‌آوردن بستر بازیابی تمام‌متن، زمینه جلوگیری از ریزش کاذب و صرفه‌جویی در وقت و انرژی کاربران را فراهم خواهد کرد. گفتنی است برای رفع ابهام معنایی هم‌نویسه‌های تخصصی، برچسب‌ها منابع ارزشمندی‌اند، اما این مستلزم بهره‌مندی از مجموعه آموزش باکیفیت است. نتایج پژوهش نشان می‌دهد که داده‌های آموزشی، که به‌خوبی ساختاربندی شده باشند، نقش بسیار مهمی در بهبود رفع ابهام معنایی هم‌نویسه‌های تخصصی ایفا می‌کنند. این پژوهش به‌صورت تجربی و تحلیلی نشان داد که رویکرد پیکره‌مدار در مقایسه با جست‌وجوی مبتنی بر کلیدواژه، به‌طور معنا‌داری سطح ایده‌آلی از ریزش کاذب را به‌دست می‌دهد. روش به‌کاررفته برای رفع ابهام معنایی هم‌‌نویسه‌های تخصصی در همه زبان‌ها کاربرد دارد.
کلیدواژه هم‌نویسه‌های تخصصی، برچسب‌گذاری معنایی، ریزش کاذب، پیکره متنی، رفع ابهام معنایی
آدرس دانشگاه الزهرا, ایران, دانشگاه الزهرا, گروه علم اطلاعات و دانش‌شناسی, ایران, دانشگاه الزهرا, دانشکده ادبیات, گروه زبان انگلیسی, ایران
پست الکترونیکی mirzaeian@alzahra.ac.ir
 
   Effectiveness of Semantic Tagging in Sense Disambiguation of Specialized Homographs from the Perspective of False Drop in Retrieving Scientific Texts  
   
Authors Rezaei Dinani Mina ,Karbala Aghaei Kamran Masoumeh ,Mirzaeian VahidReza
Abstract    Purpose: The key problem in achieving efficient and user friendly retrieval when specialized homographs are searched is the development of a search mechanism to guarantee delivery of minimal irrelevant information (false drop=0). This paper has solved the problem through the implementation of a corpusbased approach using semantic tagging. The aim has been to optimize information retrieval system’s performance using semantic tagging of specialized homographs to decrease false drop.Method: This research was conducted experimentally and employed one of the three methods of word sense disambiguation. The research sample consisted of 442 scientific articles of two groups ie, experimental group and the control group. The control group had 221 fulltext articles without tags and the experimental group included the same number articles, but manually tagged and placed in the proposed retrieval system to measure the effectiveness of tags in disambiguating specialized homographs and decreasing false drop.Findings: While retrieval in the control group was with false drops due to the semantic ambiguity of specialized homographs, tagging specialized homographs in the full text of articles in the experimental group had a direct effect on decreasing false drop. The level of significance of the Wilcoxon signedrank test (P = 0.0001, Z = 5.909) showed that the rate of false drop of retrieval results after using the tagged specialized corpus in the information retrieval system was significantly different. Assessment of negative and positive rankings showed that the rate of false drop of the results after using the tagged specialized text corpus decreased significantly and reached its minimum level of 0.Conclusion: The rate of false drop in the research findings is an evidence of acceptable tagging effectiveness in Sense Disambiguation of specialized homographs and its effective role in optimizing the information retrieval system to minimize false drop of the results.  Accordingly, the corpusbased approach of the information retrieval system, while providing an opportunity for fulltext retrieval could prevent false drop and save the user time and energy. Semantic tags are valuable for disambiguation of specialized homographs, but require high quality training data. Overall, the results show that wellstructured training data can play a very important role to improve disambiguation. This research experimentally and analytically reveals that this approach, compared to keyword search, achieves a significantly better degree of false drop. The technique employed can be applied to the problem of information retrieval in all languages
Keywords
 
 

Copyright 2023
Islamic World Science Citation Center
All Rights Reserved