|
|
یک چارچوب توزیعی مبتنی بر خوشه بندی دومرحله ای برای شناسایی چهره در مقیاس بالا
|
|
|
|
|
نویسنده
|
احمدی محمد ,دیانت روح الله
|
منبع
|
پردازش علائم و داده ها - 1403 - شماره : 1 - صفحه:53 -70
|
چکیده
|
شناسایی چهره از پرکاربردترین حوزه های بینایی ماشین در دهه اخیر محسوب می شود. با قدرتمندترشدن مدل های هوشمند در زمینه بازشناسی چهره، استفاده عملی از آن در کاربردهای بات عداد افراد بسیار بالا رایج شد هاست ؛ اما افزایش تعداد افراد در شناسایی چهره، یک چالش عمده محسوب می شود که به نوبه خود به سه زیرچالش دیگر قابل تحویل است: زیرچالش افت دقت ؛ زیرچالش افزایش نیازمندی به حافظه ؛ و زیرچالش افزایش پیچیدگی زمانی. به منظور حل این چالشها، راه حل های گوناگونی ارائه شد ه اند. برخی از راه حلها به تقویت عناصر موجود در شبکه های عصبی عمیق، همچون تابع هزینه و یا ارائه بلاک های جدید در شبکه ها پرداخته اند.دسته دیگری از راه حلها، به خصوص برای حل چالشهای حافظه و زمان، به راه حل های توزیعی پناه برد ه اند. این پژوهش، یک رویکرددومرحله ای توزیعی معرفی کرد ه و مدعی است که هر سه چالش را به صورت همزمان، تا حد خوبی، مرتفع کرده است . روش پیشنهادی،دربرگیرنده سه واحد است: واحد زیرشبکه ها، واحد خوشه یاب، و واحد تصمیم گیر نهایی. یکی از تفاوت های روش پیشنهادی با روشهای توزیعی موجود، این است که بر خلاف سایر روشها که توزیع دسته ها در زیرشبکه ها به صورت تصادفی انجام میشوند، روش ارائه شده، از خوشه بندی به عنوان روش توزیع مسئله به زیرشبکه ها استفاده میکند. هر زیرشبکه، یک شبکه عصبی عمیق نظارتی است که با داده های آموزشی مربوط به دسته های خود آموزش میبیند. واحد خوشه یاب، شباهت بردارهای ویژگی داد ههای آزمون را با میانگین بردارهای ویژگی دسته ها مقایسه و بهترین خوشه را پیدا میکند ؛ درنهایت، واحد تصمیم گیر نهایی با ترکیب نتایج دو واحدقبلی، بهترین دسته را انتخاب میکند. نتایج نشان میدهد که روش پیشنهادی، در مقایسه با روش های مشابه، از نظر صحت، بازخوانی، و امتیاز f1 عملکرد بهتری دارد. این روش ضمن سریع تربودن، دارای دقت بالاتری نسبت به روشهای بدون توزیع است و در مقایسه با روشهای توزیعی تصادفی، سرعتی برابر و دقتی بالاتر دار د. آزمایشها بر روی تعدادی از مشهورترین و معتبرترین مجموعه دادگان حوزه شناسایی چهره اجرا شد هاست، همچون vggface2 و ms-celeb-1m و glint360k که هر یک شامل تصاویر تعداد زیادی از افراد هستند. نتایج پیاده سازی نشان میدهند که روش پیشنهادی، علاوه بر عملکرد بهتر، مقیاس پذیری بالاتری را در شناسایی چهره دارد .
|
کلیدواژه
|
بازشناسی چهره، شناسایی چهره، خوشهبندی، یادگیری عمیق، یادگیری توزیعی
|
آدرس
|
دانشگاه قم, دانشکده فنی و مهندسی, گروه مهندسی کامپیوتر و فناوری اطلاعات, ایران, دانشگاه قم, دانشکده فنی و مهندسی, گروه مهندسی کامپیوتر و فناوری اطلاعات, ایران
|
پست الکترونیکی
|
rdianat@qom.ac.ir
|
|
|
|
|
|
|
|
|
a two-stage clustering-based distributed framework for large-scale face identification
|
|
|
Authors
|
ahmadi mohammad ,dianat rouhollah
|
Abstract
|
face recognition poses challenges in accuracy, memory efficiency, and computational complexity. this study proposes a two-stage, three-module approach: subnetwork modules, cluster-finder unit, and final-decision module. unlike random distribution methods, our approach employs clustering for distribution. each subnetwork, a supervised deep neural network, is trained with cluster-specific data. the cluster-finder unit compares test data similarity with each subnetwork’s representative. the final-decision module selects the best class. results indicate superior accuracy, recall, and f1 score compared to competitive methods. the approach is faster and more accurate than non-distribution methods, with comparable speed and higher accuracy than random distribution methods. experiments on vggface2, ms-celeb-1m, and glint360k datasets confirm both superior performance and scalability. the proposed method, using kmeans for distribution, outperforms softmax dissection and dynamic active class selection. it simplifies training without additional manipulations, offering efficiency over methodologies like softmax dissection and arcface parallelization. in conclusion, this study focuses on pre-processing and post-processing without added training complexity. a divide-and-conquer approach addresses accuracy and efficiency challenges. in this study, various sources leading to errors in face recognition systems have been examined. these sources include: imprecise features, overfitting, challenging classes, distribution issues, and decision-making complexities. various classification scenarios are explored, including non-distributed and models with random and intelligent distributions. inaccurate features uniformly impact all scenarios, with overfitting posing the greatest challenge in non-distributed scenarios. challenging classes are better distinguished in intelligent distribution scenarios. inappropriate distribution has less impact in intelligent scenarios, and decision-making challenges exist in both distributions
|
Keywords
|
face recognition ,face identification ,clustering ,deep learning ,distributed learning
|
|
|
|
|
|
|
|
|
|
|