|
|
واژههای ویژۀ زبان فارسی: خلاهای موجود در انطباق واژگانی فارسنت با شبکۀ واژگانی پرینستون (وردنت)
|
|
|
|
|
نویسنده
|
حسابی اکبر
|
منبع
|
جستارهاي زباني - 1394 - دوره : 6 - شماره : 6 - صفحه:75 -103
|
چکیده
|
این پژوهش به بررسی انطباق فارسنت با شبکۀ واژگانیِ انگلیسی پرینستون (وردنت) میپردازد و در پی پاسخ به پرسشهای زیر است: آیا دستههای هممعنایی که در فارسنت بدون تطابق با وردنتاند، واژههای ویژۀ زبان فارسیاند؟ بهعبارتدیگر آیا این واژهها در زبان انگلیسی آمریکایی و یا شبکۀ واژگانی پرینستون واقعاً خلا واژگانی بهشمار میروند؟ پرسش دیگر اینکه این موارد را چگونه میتوان تقسیمبندی کرد و درصد هرکدام به چه میزان است؟ آیا میتوان برای بعضی از آنها با کنکاش و بررسی بیشتر معادلی در انگلیسی یا وردنت پرینستون یافت؛ بهعبارتدیگر آیا میتوان گفت، خلا واژگانی نیستند؛ بلکه علت، عدم سهولتِ یافتن معادلهای آنهاست؟ به این منظور، با بررسی نمونهای شامل 2000 دستۀ هممعنای فارسنت به مواردی که بدون انطباق با دستههای هممعنای وردنتاند، پرداخته میشود. دستههای هممعنای یادشده استخراج میشوند که حدوداً پانزده درصد از نمونهها را به خود اختصاص میدهند. طبقهبندی و بررسی موارد یادشده حاکی از این امر است که درحدود دوسوم از مواردِ بدون انطباق، واژههای ویژۀ زبان فارسیاند و یکسوم دیگر به علل دیگری بدون انطباقاند که بسیاری از آنها واژههای ویژۀ زبان فارسی نیستند. در پایان با تکمیل اطلاعات موجود در وردنت و فارسنت برای برخی از دستههای هممعنای بدون انطباق در فارسنت میتوان معادلهایی در وردنت یا زبان انگلیسی یافت و با تکمیل اطلاعات وردنت میتوان میان دستههای هممعنای فارسنت و آنها انطباق برقرار کرد.
|
کلیدواژه
|
کلیدواژهها: وردنت، فارسنت، انطباق، خلاواژگانی، واژگانیشدگی
|
آدرس
|
دانشگاه اصفهان, ایران
|
پست الکترونیکی
|
a.hesabi11@yahoo.com
|
|
|
|
|
|
|
|
|
Specific Words of Persian? Lexical Gaps in Mapping Synsets of FarsNet and Princeton WordNet
|
|
|
Authors
|
hesabi Akbar
|
Abstract
|
This study investigated the mapping between Farsnet and Princeton English WordNet (PWN) and tried to answer these questions: Are the unmapped synsets in FarsNet with Princeton WordNet Persian specific lexical items? How can these cases be classified? Is it possible to find equivalents for some of these cases in PWN? In other words, were all of the equivalents of these lexical elements not lexicalized in English or there is another reason for that? For this purpose, a sample including 2000 synsets of FarsNet was selected and unmapped synsets were analyzed. Out of the sample, near 15 percent of the synsets had no mapping. The Categorization and analysis of the selected synsets showed that less than two third of these synsets were Persian specific words and more than one third were synsets that were unmapped due to other reasons and therefore those are not specific lexical items in Persian. By enriching and completing the information in PWN and then FarsNet a lot of these cases can be mapped with PWN synsets.
|
Keywords
|
|
|
|
|
|
|
|
|
|
|
|