>
Fa   |   Ar   |   En
   تشخیص داده‌های پَرت در داده‌های جریانی با استفاده از مدل مبتنی بر qlattice و یادگیری بر خط  
   
نویسنده فردین سحر ,هاشم‌زاده مهدی
منبع پردازش علائم و داده ها - 1402 - شماره : 2 - صفحه:81 -98
چکیده    تشخیص داده‌های پَرت در جریان داده (داده‌های جریانی)، که ویژگی‌های خاصی نظیر نامحدود بودن و گذرا بودن را دارند، چالش‌های زیادی دارد. برای این منظور، در این پژوهش، یک رویکرد مبتنی بر مدل طبقه بندی qlattice، که بر مبنای محاسبات کوانتوم کار می کند و در کاربرد مورد هدف عملکرد بهتری نسبت به دیگر روش‌های طبقه‌بندی دارد، معرفی می‌کنیم. با توجه به امکان تغییر توزیع داده ها در طول زمان در داده‌های جریانی، طرحی برای بهره‌گیری از یادگیری افزایشی آنلاین نیز در روش پیشنهادی ارائه می‌شود. با توجه به نامحدود بودن جریان داده ها و حافظه ی پردازشی محدود، فرآیند تشخیص بر روی پنجره‌ای از داده‌ها که همواره با داده‌های نمونه‌برداری شده از پنجره‌های قبلی به‌روزرسانی می‌شود، اعمال می‌گردد. تابعی نیز برای حل مشکل نامتوازن بودن داده ها طراحی شده که از روش نمونه برداری برای حل این مشکل بهره می گیرد. نتایج آزمایشات نشان می دهد که رویکرد پیشنهادی دقت عملکرد بهتری نسبت به روش های دیگر دارد.
کلیدواژه تشخیص داده پرت، جریان داده، یادگیری آنلاین، یادگیری افزایشی و داده‌ کاوی
آدرس دانشگاه شهید مدنی آذربایجان, دانشکده فناوری اطلاعات و مهندسی کامپیوتر، آزمایشگاه تحقیقاتی هوش مصنوعی و یادگیری ماشین, ایران, دانشگاه شهید مدنی آذربایجان, دانشکده فناوری اطلاعات و مهندسی کامپیوتر، آزمایشگاه تحقیقاتی هوش مصنوعی و یادگیری ماشین, ایران
پست الکترونیکی meh_hashemzadeh@yahoo.com
 
   outlier detection on data streams using a qlattice-based model and online learning  
   
Authors fardin sahar ,hashemzadeh mahdi
Abstract    with the advancement of computer science, the dramatic developments in data mining area and their increasing applications, the identification of outlier or anomaly data has also become one of the most important research topics. in most applications, the outlier data contain beneficial information that can be used to gain useful knowledge. today, there are a large number of applications on data streams, in the vast majority of which the discovery of outlier/anomaly data is very important and in some cases vital. detection of anomalies is an important way for detecting frauds, network intrusion detection, detection of abnormal behaviors in monitoring systems, and other rare events that are always of great importance; but they are often difficult to identify. most of the existing efficient outlier detection algorithms have been designed for the static data. while outlier detection is more challenging in data streams, where data are generating continuously and has especial properties such as infinity and transience. in this research, we introduce an approach based on the qlattice classification model, which works based on the quantum computing and performs better in the intended application than other classification methods. given the possibility of changing the distribution of data over time in streaming data, a scheme to take advantage of online incremental learning is also applied in the proposed method. considering the unlimited data flow and limited processing memory, the detection process is applied to a window of data that is constantly updated with data sampled from previous windows. a function is also designed to solve the problem of data imbalance, which uses the random sampling technique to solve this issue. the results of experiments obtained on benchmark datasets show that the proposed approach has better performance than other methods.
Keywords outlier detection ,data streams ,online learning ,incremental learning ,data mining
 
 

Copyright 2023
Islamic World Science Citation Center
All Rights Reserved