|
|
پیادهسازی سیستم حذف ابرپیوندهای نویزی با استفاده از رویکرد معنایی و رابطهای آنتولوژی dbpedia
|
|
|
|
|
نویسنده
|
تقندیکی کاظم
|
منبع
|
كارافن - 1402 - دوره : 20 - شماره : 3 - صفحه:485 -507
|
چکیده
|
همان طور که داده های وب به سرعت در حال گسترش و رشد هستند، ساختار گراف وب که یک نمایش گرافیکی از دنیای وب است، در حال بزرگ شدن میباشد و به تدریج ساختار محتوایی خود را به یک ساختار غیر محتوایی تبدیل کرده است. وجود داده های هرز مانند ابرپیوندهای نویزی در گراف ساختار وب، بسیاری از الگوریتم های لینک کاوی را با مشکل مواجه ساخته و باعث کاهش سرعت و بازدهی الگوریتم های بازیابی اطلاعات گردیده است. کارهای انجام شده به حذف ابرپیوندهای نویزی با استفاده رویکردهای ساختاری و رشته ای پرداخته اند. این رویکردها به اشتباه برخی از ابرپیوندهای مفید را حذف کرده و در بعضی شرایط قادر به تشخیص ابرپیوندهای نویزی نمی باشند. در این مقاله، ابتدا توسط یک خزنده تعاملی یک مجموعه داده از ابرپیوندهای نویزی و مفید با استفاده از خزش وب سایتها ایجاد شد. سپس از طریق رویکردهای وب معنایی و امکاناتی نظیرآنتولوژی dbpedia به ساختار معنایی و رابطه ای این ابرپیوندها توجه گردید. در ادامه با فعال کردن استدلال گر آنتولوژی dbpedia، فرآیند حذف ابرپیوندهای نویزی از گراف ساختار وب صورت گرفت. آزمایشهای انجام گرفته بر روی این سیستم، دقت و توانایی تکنولوژیهای وب معنایی را در حذف ابرپیوندهای نویزی نشان می دهد.
|
کلیدواژه
|
وب معنایی، ابرپیوندهای نویزی، آنتولوژی، استدلالگر، شباهت معنایی، شباهت رابطه ای
|
آدرس
|
دانشگاه فنی و حرفهای, گروه مهندسی کامپیوتر, ایران
|
پست الکترونیکی
|
ktaghandiki@tvu.ac.ir
|
|
|
|
|
|
|
|
|
implementation of a noisy hyperlink removal system: using the semantic and relational approach of the dbpedia ontology
|
|
|
Authors
|
taghandiki kazem
|
Abstract
|
with the rapid expansion and growth of web data, the web graph structure, which is a graphical representation of the web world, is getting larger and larger and has gradually changed from a content structure to a non-content structure. the presence of junk data such as noisy hyperlinks in the web structure graph has caused problems for many link mining algorithms and reduced the speed and efficiency of information retrieval algorithms. research has been conducted to remove noisy hyperlinks using structural and string approaches. these approaches incorrectly remove some useful hyperlinks and are unable to detect noisy hyperlinks in some situations. in this paper, a dataset of noisy and useful hyperlinks was first created by an interactive crawler using website crawling. then, through semantic web approaches and facilities such as the dbpedia ontology, attention was paid to the semantic and relational structure of these hyperlinks. this was followed by activating the dbpedia ontology reasoner, the process of removing noisy hyperlinks from the web structure graph taking place. the tests performed on this system showed the accuracy and capability of semantic web technologies to remove noisy hyperlinks.
|
Keywords
|
semantic web ,noisy hyperlinks ,ontology ,reasoner ,semantic similarity ,relatedness similarity
|
|
|
|
|
|
|
|
|
|
|