|
|
مشکلات انطباق دسته های هممعنای فارس نت با دستههای هممعنای وردنت پرینستون
|
|
|
|
|
نویسنده
|
حسابی اکبر
|
منبع
|
پژوهش هاي زبان شناسي - 1394 - دوره : 7 - شماره : 2 - صفحه:101 -114
|
چکیده
|
در این پژوهش به بررسی مشکلات موجود در انتخاب معادل برای دستههای هممعنای (دسمعناهای) فارسنت پرداخته شد. اهمیت این پژوهش به این لحاظ است که نتایج آن میتواند در طرحهای آینده مربوط به تکمیل فارسنت و ساخت شبکههای واژگانی دیگر یا تخصصی مورد استفاده قرار گیرد. با توجه به وجود سه دسته از مشکلات جهت انطباق وردنتها بر همدیگر شامل الف. مشکلات ناشی از سختی در تمایز معنایی در وردنت مبدا ب. مشکلات ناشی از اصول حاکم بر وردنت مبدا و منابع زبان مقصد و ج. مشکلات ناشی از تفاوتهای ذاتی بین زبان مبدا و مقصد، به تحلیل موارد یافت شده در فارسنت پرداخته شده است. این پژوهش سعی بر پاسخ به سوالات زیر داشته است: مشکلات موجود بر سر راه انطباق دسمعناهای فارسنت با وردنت چه میباشد؟ چه مشکلاتی بسامد بیشتری دارند؟ آیا تفاوتی بین مشکلات موجود در انطباق فارسنت با وردنت و انطباق در سایر وردنتهای موجود وجود دارد؟ حجم نمونۀ مورد بررسی که به شکل تصادفی انتخاب شدهاند 1552 دسته میباشد که شامل دسمعناهایی است که اولین عضو آنها با حروف «ع، غ، ف و ق» شروع شدهاند. مشکلات یافته شده به هشت دسته تقسیم گردیدند و بسامد و درصد هر مشکل ارائه گردید و برای حل برخی از این مشکلات راههایی پیشنهاد شد. این راه حلها میتواند در فرایند تکمیل فارسنت و یا پیش از ساخت شبکههای واژگانی دیگر یا شبکههای واژگانی تخصصی مد نظر قرار گیرد.
|
کلیدواژه
|
شبکۀواژگانی، وردنت پرینستون، فارسنت، انطباق اولیه، انطباق ثانویه، زبانشناسی رایانشی
|
آدرس
|
دانشگاه اصفهان, گروه زبان انگلیسی, ایران
|
پست الکترونیکی
|
a.hesabi11@yahoo.com
|
|
|
|
|
|
|
|
|
Mapping Difficulties of Farsnet Synsets on Princeton Synsets
|
|
|
Authors
|
Hesabi Akbar
|
Abstract
|
In this research the difficulties in the mapping of Farsnet synsets with the Princeton WordNet synsets were investigated. Regarding the three kinds of difficulties in mapping of synsets between the WordNets including 1. Difficulties related to the meaning distinction in the source WordNet 2. Difficulties related to the principles underlying the source WordNet and the target language resources and 3. Difficulties related to the intrinsic differences between the source and target languages, the synsets and their mappings were investigated. This research tried to answer three questions: What are the difficulties in the mapping Farsnet synsets with Princeton Synsets? Which difficulties were more frequent? Was there any difference between the difficulties in the mapping of Farsnet synsets and Princeton WordNet and mapping of synsets of other WordNets? Considering the large amount of the data a sample of 1552 synsets were chosen randomly. With regard to the overlap of words between synsets, only the first member of the synset was taken into account. The cases were divided into eight types. For solving the observed difficulties some suggestions were proposed that can be used for Farsnet enrichment and in designing and developing other WordNets for special disciplines.
|
Keywords
|
WordNet ,Farsnet ,mapping ,Persian ,Computational linguistics
|
|
|
|
|
|
|
|
|
|
|