|
|
مقایسهی عملکرد روشهای اندازهگیری شباهت طولانیترین زیردنبالهی مشترک و چرخش زمانی پویا در دادهکاوی سریهای زمانی
|
|
|
|
|
نویسنده
|
سلیمانی غلامرضا ,عابسی مسعود
|
منبع
|
مهندسي صنايع و مديريت شريف - 1400 - دوره : 37-1 - شماره : 2 - صفحه:79 -90
|
|
|
چکیده
|
تکنیکهای دادهکاوی بهطور خاص برای دادههای ثابت طراحی شدهاند. لذا بهکارگیری آنها برای دادههای سری زمانی نیازمند اعمال تغییراتی(روش اندازهگیری شباهت) است. براساس تحقیقات اخیر، روشهای طولانیترین زیردنبالهی مشترک و چرخش زمانی پویا، از پرکاربردترین و کاراترین این روشها محسوب میشود. در این تحقیق، قصد داریم تا عملکرد این روشها را در تکنیکهای نزدیکترین همسایگی و خوشهبندی کامدوید مورد ارزیابی و مقایسه قرار داده تا بتوان از آنها با دقت بهتری در این تکنیکها و در مسائلی نظیر قسمتبندی مشتریان، زمانبندی کارگاه و ... استفاده کرد. به همین منظور از 63 مجموعه داده سری زمانی از بانک اطلاعاتی ucr، استفاده میشود. نتایج نشان میدهد که تاثیرآنها در دقت تشخیص درست دستهی سری زمانی و دقت خوشهبندی، بهطور معناداری تفاوت دارد، ولی تاثیر آنها در تعیین تعداد خوشه و نمایندهی خوشه، تفاوت معناداری ندارد.
|
کلیدواژه
|
دادهکاوی سریهای زمانی، خوشهبندی، نزدیکترین همسایگی، طولانیترین زیردنبالهی مشترک، چرخش زمانی پویا
|
آدرس
|
دانشگاه یزد, دانشکده فنی و مهندسی, گروه مهندسی صنایع, ایران, دانشگاه یزد, دانشکده فنی و مهندسی, گروه مهندسی صنایع, ایران
|
پست الکترونیکی
|
mabessi@gmail.com
|
|
|
|
|
|
|
|
|
PERFORMANCE COMPARISON OF THE LONGEST COMMON SUBSEQUENCE AND DYNAMIC TIME WARPING IN TIME SERIES DATA MINING
|
|
|
Authors
|
|
Abstract
|
Today, the use of data mining techniques such as classification, clustering, discover repetitive pattern and discover outliers in different domains including production, medicine, social, meteorology, stock exchange, sales, customer service and other areas are increasing. Data mining techniques are specifically designed for static data. Therefore, their use for time series data requires some modifications to their respective algorithms. One of these changes is the selection of the appropriate similarity measurement method, because similarity measurement methods are used in all data mining techniques. Therefore, in this research, we will evaluate and compare the effect of two commonly used and efficient methods of time series similarity measurement in data mining. This evaluation is done in relation to the effectiveness of these methods in achieving better results. These methods are the Longest Common Sub Sequence (LCSS) method and the Dynamic time Warping (DTW) method. The main purpose of this research is to compare the performance of these methods in time series data mining. The data mining techniques that used in this research are the nearestneighbor technique and kmedoids clustering algorithm. The performance evaluation process is described in the text. This process uses the nearestneighbor technique to calculate the accuracy of detection of right time series class, and uses the kmedoids clustering technique to calculate the clustering accuracy, the ability to correctly determine the number of clusters, and the ability to determine the better cluster representative. For this purpose, we use 63 time series data sets by random from a worldrenowned database that named UCR collection. The results show that the effect of LCSS method is significantly better than the effect of DTW method on the correct detection accuracy of time series class and clustering accuracy by 99% and 92.5% confidence, respectively, but there is no significant difference between them in terms of their effect in determining the number of clusters and cluster representatives. The results of this research help to use these methods in appropriate data mining techniques in issues such as customer segmentation, workshop scheduling and the like more accurately.
|
Keywords
|
|
|
|
|
|
|
|
|
|
|
|