>
Fa   |   Ar   |   En
   مقاوم‌سازی روش‌های یادگیری متریک در مقابل داده‌های پرت  
   
DOR 20.1001.2.9819099991.1399.17.1.33.6
نویسنده ذبیح زاده خواجوی داود ,منصفی رضا
منبع كنفرانس سيستم هاي هوشمند - 1399 - دوره : 17 - هفدهمین کنفرانس سیستم های هوشمند - کد همایش: 98190-99991
چکیده    در بسیاری از الگوریتم‌های یادگیری ماشین، شناسایی الگو و داده‌کاوی نیازمند آن هستیم که شباهت یا فاصله بین داده‌ها را به روش مناسب اندازه‌گیری کنیم. بعنوان مثال کارایی الگوریتم های خوشه بندی و یا طبقه بند k نزدیک‌ترین همسایه به معیار فاصله‌/شباهت بستگی دارد. معیارهایی عمومی نظیر فاصله اقلیدسی و شباهت کسینوسی که بدون توجه به مفهوم داده‌ها میزان شباهت یا فاصله آن ها را مشخص می‌کنند، در بسیاری از کاربردها کارایی مناسبی ندارند. این مساله ضرورت یادگیری متریک را نشان می‌دهد. در یادگیری متریک هدف این است که با توجه به داده‌ها معیار شباهت یا فاصله بهینه به دست آید بطوری که داده‌هایی که ازنظر مفهومی و منطقی شبیه به هم هستند، به یکدیگر نزدیک می‌شوند و داده‌هایی که ازنظر مفهومی و منطقی شبیه نیستند از یکدیگر دور شوند. در این زمینه روش های زیادی ارایه شده است، اما همچنان یکی از چالش‌های مهم و جذاب، کاهش تاثیر داده‌ پرت یا برچسب نویزی می‌باشد. در روش ارائه‌شده، مجموعه داده ورودی همزمان با یادگیری متریک، به دو بخش داده بدون خطا و بخش داده های پرت تقسیم می‌شود و یادگیری معیار فاصله تنها بر روی بخش بدون خطا انجام می شود. آزمایشات انجام شده بر روی‌داده‌های واقعی (در حضور و عدمِ حضور داده پرت و برچسب نویزی) کارایی الگوریتم ارایه شده را تایید می کند و برتری آن را نسبت به روش های همتا در مرزهای دانش در محیط های دارای نویز برچسب نشان می دهد.
کلیدواژه یادگیری متریک ,یادگیری متریک مقاوم ,یادگیری متریک نزدیک‌ترین همسایه با حاشیه بزرگ ,طبقه‌بند k نزدیک‌ترین همسایه ,داده‌های پرت ,برچسب نویزی
آدرس دانشگاه فناوری نوین سبزوار, ایران, دانشگاه فردوسی, ایران
 
     
   
Authors
  
 
 

Copyright 2023
Islamic World Science Citation Center
All Rights Reserved