خلاصه سازی چند سندی استخراجی مبتنی بر پرس و جوی متن با استفاده از تفسیر و استلزام متنی
|
|
|
|
|
نویسنده
|
ناصراسدی علی
|
منبع
|
مديريت مهندسي و رايانش نرم - 1399 - دوره : 6 - شماره : 2 - صفحه:183 -198
|
چکیده
|
یکی از مشکلات رایج شبکههای کامپیوتری حجم زیاد اطلاعات موجود در چنین شبکههایی است. در این بین، جستجو و اطلاع از محتوای اسناد متنی که گستردهترین نوع اطلاعات بر روی چنین شبکههایی هستند، بسیار مشکل و گاهی اوقات غیرممکن میباشد. هدف سیستمهای خلاصهسازی چند سندی متن، تولید کردن خلاصهای با طول ثابت از اسناد متنی ورودی ضمن پوشش حداکثری محتوای اسناد میباشد. مقالهی حاضر، روشی جدید برای خلاصهسازی اسناد متنی بر مبنای استفاده از روابط تفسیر و استلزام متنی و با فرمولهسازی مساله در قالب یک مسالهی بهینهسازی ارائه کرده است. در این روش، جملههای درون اسناد ورودی ابتدا بر اساس رابطهی تفسیر متنی خوشهبندی شده سپس امتیاز استلزام متنی برای کسری از سرآیند خوشهها که دارای بیشترین امتیاز مرتبط با پرسوجوی کاربر هستند محاسبه شده و براساس آن امتیاز نهایی هر جمله به دست میآید. در نهایت، به کمک دو رویکرد حریصانه و برنامهریزی پویا مسالهی بهینهسازی حل شده و ضمن انتخاب بهترین جملهها، خلاصهی نهایی تولید میشود. نتایج اجرای سیستم پیشنهادی بر روی مجموعهدادههای استاندارد و انجام ارزایابی بر اساس سیستم rouge نشان میدهند که این سیستم کارایی بهترین سیستمهای خلاصهسازی استخراجی مبتنی بر پرسوجو را به صورت میانگین حداقل به میزان 2.5% بهبود داده است.
|
کلیدواژه
|
پردازش زبان طبیعی، خلاصهسازی متن، تفسیر متنی، استلزام متنی، کولهپشتی صفر و یک
|
آدرس
|
مجتمع آموزش عالی زرند, گروه کامپیوتر, ایران
|
پست الکترونیکی
|
naserasadi@uk.ac.ir
|
|
|
|
|