>
Fa   |   Ar   |   En
   معرفی یک پیکره متنی تخصصی: پیکره پژوهش ‌نامه  
   
نویسنده علایی ابوذر الهام ,پاک ‌نیت نصراله ,حجت‌ پناه علی‌ اصغر ,زالی مجتبی ,آقالویی آغمیونی محمدهادی
منبع پژوهش هاي زبان شناسي تطبيقي - 1400 - دوره : 11 - شماره : 22 - صفحه:271 -289
چکیده    بسیاری از پژوهش‌های زبان‌شناسی و برنامه‌ریزی‌های زبانی با استفاده از پیکره‌های زبانی انجام می‌شود. در این پژوهش پیکره‌ای با استفاده از متون مقاله‌های پژوهش‌نامه‌ پردازش و مدیریت اطلاعات ساخته شده است. این پیکره شامل بیش از 600 مقاله (بیش از چهار میلیون واژه) است. موضوع این مقاله‌ها کتابداری و اطلاع‌رسانی، علم اطلاعات و دانش‌شناسی، فناوری اطلاعات، زبان‌شناسی، زبان‌شناسی رایانشی، اصطلاح‌شناسی، هستان‌شناسی و سایر حوزه‌های پردازش اطلاعات است. متون مقاله‌ها تخصصی و میان‌رشته‌ای است و برای پردازش‌هایی که مستلزم بهره‌گیری از متون تخصصی است، ارزشمند است. برای ساخت پیکره پس از نمونه‌گیری و وارد کردن داده‌ها در پیکره، فراداده‌ مقاله‌ها وارد پیکره شد. سپس نرمال‌سازی ماشینی و به دنبال آن برچسب‌گذاری ماشینی (نوعاً برچسب‌گذاری اجزای واژگانی کلام) انجام شد. در نهایت تعداد قابل توجهی از فایل‌های برچسب‌خورده در پیکره به صورت رندوم انتخاب شد و الگوهای زبانی برای اصلاح ماشینی و دستی برچسب‌ها استخراج و در پیکره به کار برده شد.
کلیدواژه پیکره، نرمال ‌سازی، برچسب‌گذاری اجزای واژگانی کلام
آدرس پژوهشگاه علوم و فناوری اطلاعات ایران (ایرانداک), ایران, پژوهشگاه علوم و فناوری اطلاعات ایران (ایرانداک), ایران, پژوهشگاه علوم و فناوری اطلاعات ایران (ایرانداک), ایران, پژوهشگاه علوم و فناوری اطلاعات ایران (ایرانداک), ایران, پژوهشگاه علوم و فناوری اطلاعات ایران (ایرانداک), ایران
پست الکترونیکی aghalouei@irandoc.ac.ir
 
     
   
Authors
  
 
 

Copyright 2023
Islamic World Science Citation Center
All Rights Reserved