|
|
خوشهبندی اسناد، مبتنی بر آنتولوژی و رویکرد فازی
|
|
|
|
|
نویسنده
|
امیری مریم ,ختنلو حسن
|
منبع
|
فناوري اطلاعات و ارتباطات ايران - 1392 - دوره : 5 - شماره : 17-18 - صفحه:73 -96
|
چکیده
|
داده کاوی، شناسایی و پردازش اطلاعات مفید از اسناد است که اساس آن بر مدل نمایش مفهومی اسناد، محاسبه شباهت بین اسناد و استفاده از آنها در خوشه بندی و دسته بندی اسناد، بازیابی و استخراج اطلاعات استوار است. در این مقاله روش نوینی برای نمایش آنتولوژیکال و مفهومی اسناد به صورت سلسله مراتبی ارایه شده است. با توجّه به آنتولوژی دامنه مورد نظر، گراف مفهومی از سند ایجاد میشود. بر اساس این گراف آنتولوژیکال معیار شباهت متناسبی نیز ارایه شده است که فاصله و شباهت بین اسناد را بر اساس این نوع نمایش مشخص می نماید. در گام سوم سیستم استنتاج فازی با سه ورودی و یک خروجی طراحی شده است. این سیستم بر اساس سه شباهت ورودی، مقدار شباهت نهایی را تخمین میزند. در نهایت بر اساس ماتریس شباهت اسناد، الگوریتم خوشهبندی سلسله مراتبی پایین به بالا به منظور خوشهبندی اسناد اعمال میشود. برای ارزیابی الگوریتم پیشنهادی، نتایج با نتایج حاصل از روشهای naïve bayes ، دو الگوریتم مبتنی بر آنتولوژی و یک الگوریتم آماری مقایسه شده است. نتایج به دست آمده نشان میدهند که روش پیشنهاد شده مقادیر f-measure و accuracy را بهبود میدهد. همچنین مقادیر fp و error به میزان قابل توجّهی کاهش مییابد.
|
کلیدواژه
|
گراف مفهومی اسناد ,ساختار آنتولوژیکال ,آنتولوژی ,معیار شباهت ,ساختار سلسله مراتبی ,Conceptual graph of documents ,Cal ontology structure ,Ontology ,Measure of similarity ,Hierarchical structure
|
آدرس
|
دانشگاه بوعلی سینا, کارشناس ارشد، دانشگاه بوعلیسینا، گروه کامپیوتر، همدان, ایران, دانشگاه بوعلی سینا, هییت علمی، دانشگاه بوعلیسینا، گروه کامپیوتر، همدان, ایران
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Authors
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|