>
Fa   |   Ar   |   En
   بهبود خلاصه سازی خودکار متون فارسی با استفاده از روش‌های پردازش زبان طبیعی و گراف شباهت  
   
نویسنده حسینی خواه طیبه ,احمدی عباس ,محبی آزاده
منبع پژوهشنامه پردازش و مديريت اطلاعات - 1396 - دوره : 33 - شماره : 2 - صفحه:885 -914
چکیده    پایگاه داده های متنی شامل مجموعۀ بزرگی از اسناد و منابعمختلف (مانند مقالات خبری، کتاب ها، ایمیل ها و صفحات وب) است.افزایش چشمگیر این نوع اطلاعات وجود ابزارهایى براى ارزیابى خودکارمنابع متنى را بیش از هر زمان دیگرى آشکار مى سازد. در این میانخلاصه سازى خودکار متون یکى از راه کارهایى است که از اتلاف وقتکاربران مى کاهد. خلاصه سازى استخراجى به معناى انتخاب مهم ترینجملات یک متن با هدف کوتاه نمودن آن است به شکلى که اطلاعاتمهم متن ورودى را در بر داشته باشد. در این پژوهش با به کارگیرى وترکیب روش هاى پردازش زبان طبیعى دقت خلاصه هاى استخراجىبهبود مى یابد و روشى براى اصلاح الگوریتم ها و معیارهاى امتیازدهىبه جملات ارائه مى شود. در روش پیشنهادى براى امتیازدهى به کلماتاز برچسب نقش دستورى کلمات در جمله به عنوان ضریب اهمیت کلماتاستفاده مى شود که در نتیجه، با انتخاب بهتر کلمات و جملاتى که بارمحتوایى بیشترى دارند، دقت خلاصه سازى افزایش مى یابد. علاوه بر آن،براى انتخاب جملات مناسب از متن از روش هاى مبتنى بر گراف شباهتاستفاده مى شود، به گونه اى که با تغییر وزن جملات انتخاب شده درپیمایش گراف، در هر گام چالش افزونگى اطلاعات برطرف مى گردد.و « بازخوانى » در نهایت، نتایج به دست آمده با معیارهاى استانداردى مانند « دقت » بر روى یک پیکره متنى استاندارد فارسى نیز ارزیابى مى شود.
کلیدواژه خلاصه سازی استخراجی، پردازش زبان طبیعی، برچسب گذاری دستوری کلمات، گراف شباهت
آدرس دانشگاه صنعتی امیرکبیر, ایران, دانشگاه صنعتی امیرکبیر, ایران, پژوهشگاه علوم و فناوری اطلاعات ایران, ایران
پست الکترونیکی mohebi@irandoc.ac.ir
 
   A new Persian Text Summarization Approach based on Natural Language Processing and Graph Similarity  
   
Authors Hosseinikhah Tayyebeh ,Ahmadi Abbas ,Mohebi Azadeh
  
 
 

Copyright 2023
Islamic World Science Citation Center
All Rights Reserved