>
Fa   |   Ar   |   En
   استخراج خودکار کلمات کلیدی از متون فارسی  
   
نویسنده سلطان زاده فاطمه ,افتخاری سید احمد ,رضایی شریف آبادی مرتضی ,خزاعلی علیرضا
منبع اولين همايش ملي هوش مصنوعي و محاسبات نرم در علوم انساني - 1398 - دوره : 1 - اولین همایش ملی هوش مصنوعی و محاسبات نرم در علوم انسانی - کد همایش: 98190-15887 - صفحه:0 -0
چکیده    استخراج کلمات کلیدی، استخراج خودکار مجموعه ای از اصطلاحات است که به بهترین شکل موضوع یک سند را توصیف می‌کنند. هدف پژوهش حاضر استخراج خودکار کلمات کلیدی از متون تخصصی به زبان فارسی است. سامانۀ طراحی شده در این پژوهش از روش tf-idf در کنار قواعد زبانشناختی خاص زبان فارسی بهره می‌جوید. در این سامانه ابتدا کلمات و عبارات کاندیدا با توجه به محدودیتهای صرفی و نحوی انتخاب شده و سپس با استفاده از روش tf-idf امتیازدهی می‌شوند و کلمات و عبارات با امتیاز بالا به عنوان کلمات کلیدی در نظر گرفته می‌شوند. به منظور ارزیابی سامانۀ استخراج کلمات کلیدی متون زبان فارسی پیکره‌ای تهیه شد که شامل شانزده کتاب دارای نمایۀ موضوعی است. تمامی کتب مذکور در حوزۀ علوم انسانی و علوم اسلامی همچون تاریخ، فلسفه، زبانشناسی، فقه و غیره می‌باشند. پیکرۀ حاصل حجمی معادل با 1010633 توکن دارد. نتایج ارزیابی این سامانه بر روی متون تخصصی حوزۀ علوم انسانی و اسلامی حاکی از این است که میانگین همساز دقت و بازخوانی این سامانه معادل با 8.98 است که تقریباً برابر با نمونۀ مشابه آن در زبان انگلیسی است.
کلیدواژه پردازش زبان طبیعی، استخراج خودکار کلمات کلیدی، زبان فارسی، الگوریتم tf-idf، نمایه موضوعی، پیکره زبانی
آدرس , iran, , iran, , iran, , iran
 
   na  
   
Authors
Abstract    na
Keywords na
 
 

Copyright 2023
Islamic World Science Citation Center
All Rights Reserved