>
Fa   |   Ar   |   En
   خلاصه‌سازی چندسندی اخبار برخط مبتنی بر توابع زیرپیمانه با قابلیت یادگیری  
   
DOR 20.1001.2.9919046224.1399.6.1.11.6
نویسنده قدیمی علیرضا ,بیگی حمید
منبع وب پژوهي - 1399 - دوره : 6 - ششمين کنفرانس بين المللي وب پژوهي - کد همایش: 99190-46224
چکیده    با افزایش انتشار برخط اطلاعات و گسترش کاربران اینترنت، نیاز به خلاصه‌سازی خودکار متن ضرورت بیشتری یافته است. در این مقاله، یک روش خلاصه‌سازی چند سندی مبتنی بر توابع زیرپیمانه قابل یادگیری ارایه می‌شود. با استفاده از زیرپیمانگی، امکان تضمین کیفیت راه حل وجود دارد. در روش ارایه شده، سندهای متنی ورودی با استفاده از گراف‌های وزن‌دار مدل‌سازی می‌شوند که راس‌ها، بازنمایی‌کننده‌ی جملات و یال‌ها نشان‌دهنده‌ی شباهت بین جملات است. با استفاده از این گراف، ویژگی‌هایی که نشان‌دهنده‌ی اهمیت و تاثیر هر جمله است، استخراج می‌شوند. ویژگی‌های اهمیت، ارزش هر جمله را مستقل از جملات دیگر در نظر می‌گیرند. برای مدل‌سازی این ویژگی‌ها، از توابع پیمانه‌ای استفاده می‌شود. ویژگی‌های تاثیر، ارزش هر جمله را با توجه به ارتباط آن با جملات دیگر در نظر می‌گیرند. برای مدل‌سازی این ویژگی‌ها، از توابع زیرپیمانه‌ای استفاده می‌گردد. این ویژگی‌ها اجزای سازنده‌ی تابع هدف را تشکیل می‌دهند که معادل با یک شبکه‌ی عصبی متعارف است. از همین رو، از یک مجموعه‌ی آموزشی جهت آموزش شبکه‌ استفاده می‌شود. پس از اجرای فرآیند یادگیری، از این تابع به منظور خلاصه‌سازی استخراجی چندسندی استفاده می‌شود. این خلاصه‌ساز با استفاده از پیکره‌ی پاسخ و duc 2004 آزمایش شده، و نتایج حاصل از آن ارایه گردیده است.
کلیدواژه خلاصه‌سازی چندسندی ,زیرپیمانگی ,شبکه عصبی ,گراف وزن‌دار.
آدرس پژوهشکده فناوری اطلاعات و ارتباطات جهاد دانشگاهی, ایران, دانشگاه صنعتی شریف, ایران
پست الکترونیکی beigy@sharif.edu
 
   Multi-document Online News Summarization by Learnable Submodular Functions  
   
Authors
Abstract    With the increasing rate of online information generation and the growth of Internet users, the need for automatic text summarization has become more urgent. In this paper, a multi-document summarization method based on learnable submodular functions is provided. Using submodularity, it is possible to guarantee the quality of solution. Input text documents are modeled using weighted graphs, where nodes and edges represent sentences and similarities between them, respectively. Using this graph, the features that indicate the significance and impact of each sentence are extracted. Significance features consider the value of any sentence, independent of other ones. Modular functions are used to model these features. On the other hand, impact features consider the relationships between sentences. For modeling these features, submodular functions are used. These features are the building blocks of the target function which is equivalent to an ordinary neural network. Therefore, using a training set, network learns how to summarize text. After learning phase, the obtained function is used to summarize input texts. The summarizer has been examined using Pasokh and DUC 2004 datasets, and its results are presented.
Keywords Multi-Document Summarization ,Submodularity ,Neural Network ,Weighted Graph.
 
 

Copyright 2023
Islamic World Science Citation Center
All Rights Reserved