>
Fa   |   Ar   |   En
   خوشه‌بندی اسناد، مبتنی بر آنتولوژی و رویکرد فازی  
   
نویسنده امیری مریم ,ختن‌لو حسن
منبع فناوري اطلاعات و ارتباطات ايران - 1392 - دوره : 5 - شماره : 17-18 - صفحه:73 -96
چکیده    داده کاوی، شناسایی و پردازش اطلاعات مفید از اسناد است که اساس آن بر مدل نمایش مفهومی اسناد، محاسبه شباهت بین اسناد و استفاده از آن‌ها در خوشه بندی و دسته بندی اسناد، بازیابی و استخراج اطلاعات استوار است. در این مقاله روش نوینی برای نمایش آنتولوژیکال و مفهومی اسناد به صورت سلسله مراتبی ارایه شده است. با توجّه به آنتولوژی دامنه مورد نظر، گراف مفهومی از سند ایجاد می‌شود. بر اساس این گراف آنتولوژیکال معیار شباهت متناسبی نیز ارایه شده است که فاصله و شباهت بین اسناد را بر اساس این نوع نمایش مشخص می نماید. در گام سوم سیستم استنتاج فازی با سه ورودی و یک خروجی طراحی شده است. این سیستم بر اساس سه شباهت ورودی، مقدار شباهت نهایی را تخمین می‌زند. در نهایت بر اساس ماتریس شباهت اسناد، الگوریتم خوشه‌بندی سلسله مراتبی پایین به بالا به منظور خوشه‌بندی اسناد اعمال می‌شود. برای ارزیابی الگوریتم پیشنهادی، نتایج با نتایج حاصل از روش‌های naïve bayes ، دو الگوریتم مبتنی بر آنتولوژی و یک الگوریتم آماری مقایسه شده است. نتایج به دست آمده نشان می‌دهند که روش پیشنهاد شده مقادیر f-measure و accuracy را بهبود می‌دهد. همچنین مقادیر fp و error به میزان قابل توجّهی کاهش می‌یابد.
کلیدواژه گراف مفهومی اسناد ,ساختار آنتولوژیکال ,آنتولوژی ,معیار شباهت ,ساختار سلسله مراتبی ,Conceptual graph of documents ,Cal ontology structure ,Ontology ,Measure of similarity ,Hierarchical structure
آدرس دانشگاه بوعلی سینا, کارشناس ارشد، دانشگاه بوعلی‌سینا، گروه کامپیوتر، همدان, ایران, دانشگاه بوعلی سینا, هییت علمی، دانشگاه بوعلی‌سینا، گروه کامپیوتر، همدان, ایران
 
     
   
Authors
  
 
 

Copyright 2023
Islamic World Science Citation Center
All Rights Reserved