|
|
ارائه یک روش مبتنی بر هستان شناسی برای کاوش قواعد هم آیی در محیط های توزیعشده چندعاملی
|
|
|
|
|
نویسنده
|
صابری حسین ,کنگاوری محمدرضا ,حسنی آهنگر محمد رضا
|
منبع
|
پدافند الكترونيكي و سايبري - 1400 - دوره : 9 - شماره : 1 - صفحه:1 -17
|
چکیده
|
کاوش قواعد هم آیی توزیعشده یکی از روش های مهم دادهکاوی است که وابستگی بین اقلام دادهای را از منابع دادهای غیرمتمرکز، بدون توجه به مکان فیزیکی آنها و بر مبنای فرآیند استخراج اقلام مکرر استخراج میکند. هنگامی که الگوریتم های کاوش روی داده های بزرگمقیاس اجرا می شوند، مقدار زیادی اقلام مکرر تولید می گردد که بسیاری از آنها غیر مرتبط، مبهم و غیر قابل استفاده برای کسب و کار است و سبب بروز چالشی به نام انفجار ترکیبی خواهد شد. در این مقاله یک روش ائتلافی جدید مبتنی بر داده کاوی توزیع شده و هستان شناسی دامنه که بهاختصار darmaso نامیده می شود برای برخورد با این چالش پیشنهاد شده است. این روش از سه الگوریتم به نام armasomain جهت هدایت و کنترل فرآیند کاوش و تجمیع قواعد هم آیی، darmasopru برای کاهش و هرس دادهها و الگوریتم darmasoint برای کاوش و تجمیع قواعد هم آیی تولیدشده از منابع داده ای توزیعشده استفاده می کند. darmaso از یک الگوی محاسباتی توزیعشده مبتنی بر چارچوب نگاشتکاهش در محیط توزیعشده چندعاملی استفاده می کند. همچنین یک روش عملی را برای کاوش معنایی از مجموعه داده های بزرگمقیاس فراهم می کند. این روش، قواعد هم آیی را مبتنی بر اهداف داده کاوی و نیاز کاربر فیلتر کرده و فقط قواعد مفید را تولید و نگهداری می کند.کاهش فضای کاوش و فیلترسازی قواعد، با فرآیند هرس معنایی در قالب حذف نامزدهای نامناسب از مجموعه اقلام مکرر و تولید قواعد هم آیی سودمند حاصل می شود. پیادهسازی با استفاده از یک مجموعه داده ای از دامنه حوادث طبیعی و کلاس زمینلرزه انجام شده است. نتایج ارزیابی با استفاده از معیارهای کمی و کیفی نشان می دهد، الگوریتم های ارائهشده در darmaso ، فضای کاوش را به میزان قابل توجهی کاهش می دهد. همچنین سرعت و کیفیتِ استخراج قواعد را بهبود بخشیده و قواعدِ کاربردی، مطمئن، منطقی، با کیفیت و ارزشمندی را برای پشتیبانی از تصمیمگیری از میان انبوه داده ها تولید می کند.
|
کلیدواژه
|
قواعد هم آیی، هستانشناسی، سامانههای چندعاملی، نگاشت کاهش
|
آدرس
|
دانشگاه جامع امام حسین(ع), ایران, دانشگاه علم و صنعت ایران, ایران, دانشگاه جامع امام حسین(ع), ایران
|
|
|
|
|
|
|
|
|
|
|
Providing an OntologyBased Method for Exploring the Association Rules in MultiAgent Distributed Environments
|
|
|
Authors
|
Saberi H. ,Kangaavari M. R. ,Hasani Ahangar M. R.
|
Abstract
|
Distributed association rules mining is one of the most important data mining methods that extracts the inter dependence of data items from decentralized data sources, regardless of their physical location and is based on the process of extracting repeated items. When exploration algorithms are implemented on largescale data, a large number of recurring items are produced, many of which are irrelevant, ambiguous, and unusable for the business, thus causing a challenge called combination explosion . In this paper, a new coalition method based on distributed data mining and domain archeology, abbreviated to DARMASO, is proposed to address this challenge. This method uses three algorithms: the DARMASOMAIN algorithm to guide and control the process of exploration and aggregation of universal rules, the DARMASOPRU algorithm to reduce and prune the data and the DARMASOINT algorithm to explore and aggregate the rules of all the generated data sources. DARMASO uses a mapreducebased distributed computational model in a multiagent distributed environment. It also provides a practical way for semantic mining of largescale data sets. This method filters out the association rules of generality based on the purposes of data mining as well as the needs of the user and only produces and maintains useful rules. Reducing the scope of exploration and filtration of rules is achieved through the process of semantic pruning in the form of removing inappropriate candidates from the set of frequent items and producing association rules of utility. The implementation is performed using a data set from the scope of natural disasters and the earthquake class. It also improves the speed and quality of rule extraction and generates practical, reliable, logical, quality and valuable rules to support decisionmaking amid the masses of data.
|
Keywords
|
|
|
|
|
|
|
|
|
|
|
|