|
|
تاثیر برچسبگذاری معنایی در رفع ابهام همنویسههای تخصصی از نظر ریزش کاذب در بازیابی متون علمی
|
|
|
|
|
نویسنده
|
رضایی دینانی مینا ,کربلا آقایی کامران معصومه ,میرزاییان وحیدرضا
|
منبع
|
مطالعات كتابداري و سازماندهي اطلاعات - 1401 - دوره : 33 - شماره : 1 - صفحه:107 -124
|
چکیده
|
هدف: مسئله اصلی در بازیابی موثر و کاربرمدار همنویسههای تخصصی، توسعه فرایندی است که بازیابی اطلاعات نامرتبط را به حداقل برساند (ریزش کاذب= 0). در این مقاله سعی شده با بهکارگیری رویکرد پیکرهمدار با استفاده از برچسبگذاری معنایی، بازیابی مدارک حاوی همنویسههای تخصصی ارزیابی و با راهبردهای موجود (بدون برچسبگذاری) مقایسه و یافتهها آشکار شود. هدف بهینهسازی کارایی نظام بازیابی اطلاعات در کاهش ریزش کاذب بازیابی متون علمی با استفاده از روش رفع ابهام معنایی از همنویسههای تخصصی به کمک برچسبگذاری معنایی بوده است.روش: پژوهش بهدلیل ماهیتش به روش تجربی انجام شد. روش تجربی از روشهای سهگانه رفع ابهام معنایی (بانظارت، نیمهنظارتی و بدون نظارت) بوده و روشی بانظارت بهشمار میرود. جامعه پژوهش را 442 مقاله علمی در دو گروه گواه و آزمون تشکیل دادند. گروه گواه (پایه) شامل 221 متن کامل مقاله بدون برچسب و گروه تجربی (آزمون) شامل همان 221 مقاله، اما دارای برچسب بود که 46 همنویسۀ تخصصی آنها به روش دستی برچسبگذاری شد و در نظام بازیابی پیشنهادی قرارگرفتند و برای بررسی کارآیی برچسبها در رفع ابهام معنایی، از همنویسههای تخصصی و کاهش ریزش کاذب آزموده شدند. یافتهها: بازیابی در مقالههای گروه گواه بهدلیل ابهام معنایی همنویسههای تخصصی، با ریزش کاذب همراه بود؛ درحالیکه برچسبگذاری همنویسههای تخصصی در متن کامل مقالههای گروه تجربی، تاثیر مستقیمی در کاهش ریزش کاذب داشت. سطح معنیداری آزمون رتبههای علامتدار ویلکاکسون (z=-5/909, p=0/0001) نشان داد که میزان ریزش کاذب نتایج بازیابی بعد از بهکارگیری پیکره تخصصی برچسبگذاریشده در نظام بازیابی اطلاعات بهنسبت قبل، تفاوت معناداری داشت. بررسی رتبههای منفی و مثبت نشان داد که میزان ریزش کاذب نتایج بازیابی بعد از بهکارگیری پیکره تخصصی برچسبگذاریشده به میزان معناداری کاهش یافته است.نتیجهگیری: حد ریزش کاذب در یافتههای پژوهش، گواه عملکرد قابل قبول برچسبگذاری در رفع ابهام معنایی همنویسههای تخصصی است. همچنین بیانگر نقش موثر آن در بهینهسازی نظام بازیابی اطلاعات برای بهحداقلرساندن ریزش کاذب نتایج است. بنابراین، رویکرد پیکرهمدار نظام بازیابی اطلاعات، ضمن فراهمآوردن بستر بازیابی تماممتن، زمینه جلوگیری از ریزش کاذب و صرفهجویی در وقت و انرژی کاربران را فراهم خواهد کرد. گفتنی است برای رفع ابهام معنایی همنویسههای تخصصی، برچسبها منابع ارزشمندیاند، اما این مستلزم بهرهمندی از مجموعه آموزش باکیفیت است. نتایج پژوهش نشان میدهد که دادههای آموزشی، که بهخوبی ساختاربندی شده باشند، نقش بسیار مهمی در بهبود رفع ابهام معنایی همنویسههای تخصصی ایفا میکنند. این پژوهش بهصورت تجربی و تحلیلی نشان داد که رویکرد پیکرهمدار در مقایسه با جستوجوی مبتنی بر کلیدواژه، بهطور معناداری سطح ایدهآلی از ریزش کاذب را بهدست میدهد. روش بهکاررفته برای رفع ابهام معنایی همنویسههای تخصصی در همه زبانها کاربرد دارد.
|
کلیدواژه
|
همنویسههای تخصصی، برچسبگذاری معنایی، ریزش کاذب، پیکره متنی، رفع ابهام معنایی
|
آدرس
|
دانشگاه الزهرا, ایران, دانشگاه الزهرا, گروه علم اطلاعات و دانششناسی, ایران, دانشگاه الزهرا, دانشکده ادبیات, گروه زبان انگلیسی, ایران
|
پست الکترونیکی
|
mirzaeian@alzahra.ac.ir
|
|
|
|
|
|
|
|
|
Effectiveness of Semantic Tagging in Sense Disambiguation of Specialized Homographs from the Perspective of False Drop in Retrieving Scientific Texts
|
|
|
Authors
|
Rezaei Dinani Mina ,Karbala Aghaei Kamran Masoumeh ,Mirzaeian VahidReza
|
Abstract
|
Purpose: The key problem in achieving efficient and user friendly retrieval when specialized homographs are searched is the development of a search mechanism to guarantee delivery of minimal irrelevant information (false drop=0). This paper has solved the problem through the implementation of a corpusbased approach using semantic tagging. The aim has been to optimize information retrieval system’s performance using semantic tagging of specialized homographs to decrease false drop.Method: This research was conducted experimentally and employed one of the three methods of word sense disambiguation. The research sample consisted of 442 scientific articles of two groups ie, experimental group and the control group. The control group had 221 fulltext articles without tags and the experimental group included the same number articles, but manually tagged and placed in the proposed retrieval system to measure the effectiveness of tags in disambiguating specialized homographs and decreasing false drop.Findings: While retrieval in the control group was with false drops due to the semantic ambiguity of specialized homographs, tagging specialized homographs in the full text of articles in the experimental group had a direct effect on decreasing false drop. The level of significance of the Wilcoxon signedrank test (P = 0.0001, Z = 5.909) showed that the rate of false drop of retrieval results after using the tagged specialized corpus in the information retrieval system was significantly different. Assessment of negative and positive rankings showed that the rate of false drop of the results after using the tagged specialized text corpus decreased significantly and reached its minimum level of 0.Conclusion: The rate of false drop in the research findings is an evidence of acceptable tagging effectiveness in Sense Disambiguation of specialized homographs and its effective role in optimizing the information retrieval system to minimize false drop of the results. Accordingly, the corpusbased approach of the information retrieval system, while providing an opportunity for fulltext retrieval could prevent false drop and save the user time and energy. Semantic tags are valuable for disambiguation of specialized homographs, but require high quality training data. Overall, the results show that wellstructured training data can play a very important role to improve disambiguation. This research experimentally and analytically reveals that this approach, compared to keyword search, achieves a significantly better degree of false drop. The technique employed can be applied to the problem of information retrieval in all languages
|
Keywords
|
|
|
|
|
|
|
|
|
|
|
|