|
|
معرفی یک پیکره متنی تخصصی: پیکره پژوهش نامه
|
|
|
|
|
نویسنده
|
علایی ابوذر الهام ,پاک نیت نصراله ,حجت پناه علی اصغر ,زالی مجتبی ,آقالویی آغمیونی محمدهادی
|
منبع
|
پژوهش هاي زبان شناسي تطبيقي - 1400 - دوره : 11 - شماره : 22 - صفحه:271 -289
|
چکیده
|
بسیاری از پژوهشهای زبانشناسی و برنامهریزیهای زبانی با استفاده از پیکرههای زبانی انجام میشود. در این پژوهش پیکرهای با استفاده از متون مقالههای پژوهشنامه پردازش و مدیریت اطلاعات ساخته شده است. این پیکره شامل بیش از 600 مقاله (بیش از چهار میلیون واژه) است. موضوع این مقالهها کتابداری و اطلاعرسانی، علم اطلاعات و دانششناسی، فناوری اطلاعات، زبانشناسی، زبانشناسی رایانشی، اصطلاحشناسی، هستانشناسی و سایر حوزههای پردازش اطلاعات است. متون مقالهها تخصصی و میانرشتهای است و برای پردازشهایی که مستلزم بهرهگیری از متون تخصصی است، ارزشمند است. برای ساخت پیکره پس از نمونهگیری و وارد کردن دادهها در پیکره، فراداده مقالهها وارد پیکره شد. سپس نرمالسازی ماشینی و به دنبال آن برچسبگذاری ماشینی (نوعاً برچسبگذاری اجزای واژگانی کلام) انجام شد. در نهایت تعداد قابل توجهی از فایلهای برچسبخورده در پیکره به صورت رندوم انتخاب شد و الگوهای زبانی برای اصلاح ماشینی و دستی برچسبها استخراج و در پیکره به کار برده شد.
|
کلیدواژه
|
پیکره، نرمال سازی، برچسبگذاری اجزای واژگانی کلام
|
آدرس
|
پژوهشگاه علوم و فناوری اطلاعات ایران (ایرانداک), ایران, پژوهشگاه علوم و فناوری اطلاعات ایران (ایرانداک), ایران, پژوهشگاه علوم و فناوری اطلاعات ایران (ایرانداک), ایران, پژوهشگاه علوم و فناوری اطلاعات ایران (ایرانداک), ایران, پژوهشگاه علوم و فناوری اطلاعات ایران (ایرانداک), ایران
|
پست الکترونیکی
|
aghalouei@irandoc.ac.ir
|
|
|
|
|
|
|
|
|
|
|
|
Authors
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|