|
|
|
|
کاربرد مترادفها در سرعنوانهای موضوعی فارسی و اصطلاحنامۀ اصفا بر مبنای ابزار واژگانی فارسنت
|
|
|
|
|
|
|
|
نویسنده
|
شادانپور فرزانه
|
|
منبع
|
مطالعات كتابداري و سازماندهي اطلاعات - 1403 - دوره : 35 - شماره : 4 - صفحه:7 -38
|
|
چکیده
|
هدف: ترادف یا هم معنایی از ویژگیهای مهم زبانهای طبیعی است. ازآنجاکه یک مفهوم واحد ممکن است با دو یا چند شکل واژگانی بیان شود و معلوم نیست کدام شکل واژگانی بازگوکنندۀ یک مفهوم واحد در سامانۀ بازیابی مورد جستجو قرار خواهد گرفت، سامانه باید بتواند از همه مترادفهای یک مفهوم به مدرکی که مفهوم در آن موردبحث قرارگرفته ارجاع دهد. این پژوهش با هدف بررسی وضعیت بهکارگیری مترادفهای سرعنوان های گزیده/ اصطلاحات مرجح را در ساخت سرعنوان های ناگزیده/ اصطلاحات نامرجح در سرعنوانهای موضوعی فارسی و اصطلاحنامۀ فرهنگی فارسی «اصفا»، در تطبیق با فارسنت، بهعنوان منبع واژگانی جامع زبان فارسی، انجام شد.روش: پژوهش از حیث هدف کاربردی و از جنبۀ روششناسی، تحلیل محتوا بود و از فنون متنکاوی و پردازش زبان طبیعی برای سنجش میزان کاربرد مترادفها در هر دو واژگان کنترلشده با سنجش شباهت دو گروه داده استفاده کرده است. 3270 سرعنوان موضوعی و 2020 اصطلاح اصلی بهصورت هدفمند از دو منبع سرعنوانهای موضوعی فارسی و اصطلاحنامۀ اصفا، بهعنوان دو مجموعه واژگان کنترلشده مورداستفاده در تدوین کتابشناسی ملی ایران، انتخاب شد. سرعنوان های ناگزیده، اصطلاحات نامرجح مربوط به هر سرعنوان/ اصطلاح اصلی و مترادف های هر یک از فارسنت نیز استخراج شد. پایایی با تکرار استخراج بخشی از سرعنوانها/اصطلاحات توسط پژوهشگر دوم با شباهت 618/ 0 و 706/ 0 از بازۀ میان صفر تا 1 به ترتیب برای سرعنوان ها و اصطلاحات به دست آمد. با استفاده از زبان برنامه نویسی پایتون شباهت میان هریک از دو دستۀ داده سرعنوان های ناگزیده و اصطلاحات نامرجح با مترادف های سرعنوان ها/ اصطلاحات اصلی مربوط به آنها در فار سنت با سنجۀ کسینوس شباهت اندازه گیری شد.یافتهها: در نمونۀ گرفتهشده از سرعنوان های موضوعی فارسی،2561 سرعنوان اصلی (3.78 درصد) دارای سرعنوان ناگزیده بودهاند که به سرعنوان گزیده ارجاع میدهد. 2316 سرعنوان اصلی (8.70 درصد) نیز دارای مترادف در فارسنت بوده اند. نمرۀ شباهت میان سرعنوان های ناگزیده و مترادف های سرعنوان اصلی مربوط به هر یک 125/ 0 به دست آمد که نشان از شباهت پایین آنهاست. همچنین در نمونۀ گرفتهشده از اصطلاحنامۀ اصفا، 545 اصطلاح (حدود 27 درصد) دارای اصطلاح ارجاعی نامرجح بودهاند. 1376 اصطلاح (68 درصد) از این اصطلاحات نیز دارای مترادف در فار سنت هستند؛ یعنی تعداد 1475 اصطلاح (73 درصد) فاقد اصطلاح نامرجح (که ارجاع به اصطلاح اصلی می دهند) بودهاند. نمرۀ شباهت میان اصطلاحات نامرجح در اصطلاحنامۀ اصفا و مترادف های اصطلاح اصلی مربوط به هر یک 0.131 به دست آمد که نمرۀ پایینی است. نتیجهگیری: در سرعنوان های موضوعی فارسی تقید بیشتری در ساخت و بهکارگیری ارجاعات موضوعی دیده میشود، ولی در هر دو واژگان کنترلشده تعداد کمی از سرعنوانها و اصطلاحات ارجاعی (ناگزیده و نامرجح) از میان مترادفهای مفاهیم در زبان فارسی انتخابشدهاند. این پژوهش معرفی مترادفهای عبارتها را برای همه کاربران، ازجمله فهرستنویسان و متصدیان ساخت مستندات موضوعی، چه هنگام جستجوی مفاهیم و چه در ساخت اصطلاحات توصیه میکند، چراکه میتواند به بهبود وضعیت بانکهای مستند موضوعی و درنهایت تجربه متکاملتر کاربر در جستجوی موضوعی و بازیابی منابع کمک کند.
|
|
کلیدواژه
|
روابط معنایی، مترادف، سرعنوانهای موضوعی فارسی، اصطلاحنامۀ فرهنگی فارسی (اصفا)، فارسنت، شباهتسنجی، کسینوس شباهت
|
|
آدرس
|
سازمان اسناد و کتابخانه ملی جمهوری اسلامی ایران, گروه پژوهش علوم داده، اطلاعات و هوش مصنوعی, ایران
|
|
پست الکترونیکی
|
fshadanpoor@yahoo.com
|
|
|
|
|
|
|
|
|
|
|
|
|
the use of synonyms in persian subject headings and asfa thesaurus based on farsnet lexical tool
|
|
|
|
|
Authors
|
shadanpour farzaneh
|
|
Abstract
|
purpose: synonymy is one of the important features of natural languages. since a single concept may be expressed by two or more lexical forms, and it is not predictable which lexical form of a single concept will be searched for, the retrieval system must be able to refer from all synonyms of the same idea to the document in which the concept is discussed. this research aimed to investigate the use of synonyms in non-preferred headings/ terms in persian subject headings and asfa thesaurus, using farsentas a comprehensive lexical source of the persian language.method: this was an applied research in terms of its goals, and used content analysis as a general methodology, specifically natural language processing techniques and tools to measure the extent to which synonyms are used to build non-preferred headings/ terms in both controlled vocabulary, by measuring the similarity of the two groups of data. 3270 main subject headings and 2020 main thesaurus terms were selected, in a purposive sampling procedure, from persian subject headings, and asfa thesaurus, as two controlled vocabulary used in the process of compiling the iran national bibliography. non-preferred headings/ terms related to each main heading/ term, as well as synonyms of each, were also extracted from farsent. reliability was obtained by repeating the extraction of a part of the headings/ terms by a second researcher with a score of 0.618 and 0.706 between zero and 1 respectively. the similarity between the two data sets of non-preferred headings/terms with the synonyms of main headings/ terms related to them in farsnet was measured using cosine similarity.findings: in the sample taken from persian subject headings, 2561 main subject headings (78.3%) have non-preferred headings that refer to them. 2316 main subject headings (70.8%) also have synonyms in farsent. the similarity score between non-preferred headings and synonyms of the corresponding main headings was 0.125, thus very low. also, in the sample taken from asfa, 545 main terms in asfa (about 27%) have non-preferred terms. 1376 terms (68%) of these main terms also have synonyms in farsnet. thus, 1475 main terms (73%) do not have non-preferred terms (which refer to the main term). the similarity score between non-preferred terms in the asfa thesaurus and the synonyms of the corresponding main terms was 0.131, very low as well.conclusion: more commitment to the construction and use of subject references in the form of non-preferred headings is observable in persian subject headings, but a small number of referential headings and terms (non-preferred) have been selected from among the synonyms of main subjects/terms in the persian language. this research recommends the introduction of synonyms of terms for all users, including catalogers and those involved in the creation of controlled vocabularies, both during the search for concepts and in the creation of terms, because it can be a step towards improving subject authority databases and, ultimately, a more exhaustive user subject search and retrieval experience.
|
|
Keywords
|
semantic relations ,synonym ,persian subject headings ,persian cultural thesaurus (asfa) ,farsnet ,similarity measuring ,cosine similarity
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|