>
Fa   |   Ar   |   En
   ترکیب مدل های یادگیری عمیق efficientnetv2b0 و مکانیزم توجه چندسر جهت تشخیص حرکات دست  
   
نویسنده آذریان پور اصفهانی فاطمه ,سلیمی عاطفه
منبع اولين كنفرانس بين المللي ايده هاي نو در مهندسي برق - 1402 - دوره : 1 - اولین کنفرانس بین المللی ایده های نو در مهندسی برق - کد همایش: 02230-21684 - صفحه:0 -0
چکیده    یکی از روش های برقراری ارتباط بین افراد، استفاده از حرکات دست است. با پیشرفت تکنولوژی در حوزه ی هوش مصنوعی و ابداع زیرشاخه های قدرتمند آن مانند شبکه های عصبی عمیق، بسیاری از تکنولوژی ها به سمت تعامل بین انسان و رایانه رفته اند. حرکات و ژست های دست یکی از مهمترین ورودی های این نوع سیستم های تعاملی است. هدف از این پژوهش، بهینه سازی یک الگوریتم مبتنی بر شبکه های عصبی عمیق است تا هم حرکات دست را با دقت بالاتری شناسایی کند و هم حجم مدل را کاهش دهد. برای این کار، از ترکیب مدل efficientnetv2b0 با مکانیزم توجه چندسر استفاده شده است. مدل efficientnetv2b0 برای استخراج ویژگی های تصاویر استفاده می شود. مکانیزم توجه چندسر نیز باعث می شود تا شبکه، فقط به مهمترین ویژگی های استخراج شده اهمیت دهد و مابقی را نادیده بگیرد. این عمل باعث می شود تا هزینه های محاسباتی و پارامترهای مورد استفاده شبکه کاهش و سرعت آموزش شبکه افزایش یابد. با کاهش پارامترهای استفاده شده ی شبکه، حجم آن نیز کاهش می-یابد. برای ارزیابی مدل ترکیبی مورد استفاده، از مجموعه داده ی حرکات دست برای اعداد صفر تا نه که در زبان اشاره ی امریکایی مرسوم است، استفاده شده است. با اعمال این مجموعه داده به مدل ترکیبی موردنظر، مشاهده شد که این مدل دارای دقت نهایی 99.70 درصد است.
کلیدواژه بینایی ماشین، پردازش تصویر، تعامل انسان با رایانه، زبان پایتون، شبکه عصبی عمیق
آدرس , iran, , iran
پست الکترونیکی atefeh.salimi@gmail.com
 
     
   
Authors
  
 
 

Copyright 2023
Islamic World Science Citation Center
All Rights Reserved