>
Fa   |   Ar   |   En
   یادگیری متریک بر اساس فاصله χ2 سریع برای دسته‌بندی داده‌های هیستوگرامی با دسته‌بندی کننده knn  
   
نویسنده صادقی حمید ,راعی ابوالقاسم اسدالله
منبع مهندسي برق دانشگاه تبريز - 1398 - دوره : 49 - شماره : 2 - صفحه:657 -668
چکیده    مقایسه داده‌ها یک مساله بنیادی و پرکاربرد در یادگیری ماشین است. در دهه گذشته تحقیقات فراوانی در زمینه یادگیری متریک انجام شده است؛ از کاربردهای یادگیری متریک می‌توان به خوشه‌بندی و دسته‌بندی داده‌ها اشاره کرد. در این مقاله یک روش یادگیری متریک مناسب برای استفاده در مسائل بینایی ماشین ارائه می‌شود. اکثر ویژگی‌هایی که در بینایی ماشین استفاده می‌شوند، هیستوگرامی هستند؛ اما روش‌های یادگیری متریک اغلب بر مبنای فاصله ماهالانوبیس طراحی شده‌اند که در ویژگی‌های هیستوگرامی کارایی مناسبی ندارد. در این تحقیق یک روش جدید یادگیری متریک برای داده‌های هیستوگرامی بر مبنای فاصله مربع کای (χ2) اصلاح شده ارائه می‌شود. فاصله χ2 در دسته‌بندی داده‌های هیستوگرامی دارای دقت بالاتری نسبت به فاصله اقلیدسی است، اما هزینه محاسباتی آن نیز بالاتر است. در این مقاله یک رابطه تقریبی برای فاصله χ2 پیشنهاد می‌شود و بخشی از محاسبات را به مرحله استخراج ویژگی (که به‌صورت غیربرخط قابل محاسبه است) منتقل می‌کند؛ به این ترتیب سرعت مقایسه ویژگی‌ها افزایش می‌یابد. آزمایش‌ها بر روی پایگاه‌های داده مختلف نشان می‌دهد که روش یادگیری متریک پیشنهادی دارای دقت بالایی در دسته‌بندی داده‌های هیستوگرامی مختلف نسبت به روش‌های موجود است. همچنین معیار تقریبی برای فاصله χ2، با حفظ دقت، سرعت مقایسه داده‌ها را 2.5 برابر افزایش می‌دهد.
کلیدواژه یادگیری متریک، فاصله مربع کای سریع، دسته‌بندی هیستوگرام، دسته‌بندی کننده knn
آدرس دانشگاه صنعتی امیرکبیر, دانشکده مهندسی برق, ایران, دانشگاه صنعتی امیرکبیر, دانشکده مهندسی برق, ایران
پست الکترونیکی raie@aut.ac.ir
 
   Metric Learning based on Fast χ2 Distance for Histogram Data Classification via KNN Classifier  
   
Authors Sadeghi H. ,Raie Abolghasem-A.
Abstract    Data comparison is a fundamental problem in machine learning research. Since, metric learning has various applications in clustering and classification problems, it is attracted much attention in the last decades. In this paper, an appropriate metric learning method is presented to utilize in machine vision problems. Common features in machine vision are often histogram; however, metric learning methods are usually designed based on Mahalanobis distance which is not applicable in histogram features. In this study, a new metric learning method based on modified chisquared distance (χ2) for histogram data is presented. In histogram data classification, χ2 distance is more accurate than Euclidean one; however, its computational cost is higher than Euclidean distance. In this paper, a χ2 distance approximated formulation where a part of its computations is moved into the feature extraction step in offline phase is proposed. Consequently, computational cost of feature comparison is reduced. Experiments on different datasets show that the proposed metric learning method is more accurate than the existing ones in histogram data classification. Moreover, the approximated χ2 distance increases feature comparison speed about 2.5 times without loss of accuracy.
Keywords
 
 

Copyright 2023
Islamic World Science Citation Center
All Rights Reserved