>
Fa   |   Ar   |   En
   طراحی سیستم تشخیص جنسیت کاربران با استفاده از ویژگیهای سیگنالهای صوت و چهره انسان  
   
نویسنده دنیاگر فریده ,قلعه خندابی امیر حسین
منبع ششمين همايش ملي فناوريهاي نوين در مهندسي برق، كامپيوتر و مكانيك ايران - 1402 - دوره : 6 - ششمین همایش ملی فناوریهای نوین در مهندسی برق، کامپیوتر و مکانیک ایران - کد همایش: 02221-18264 - صفحه:0 -0
چکیده    با توجه به تمام پیشرفت‌های صورت گرفته درزمینه سیستم‌های تشخیص جنسیت از روی چهره و صدای افراد هنوز استفاده از این سیستم‌ها در مکان‌های عمومی مانند استخرها، مساجد، کلاس‌های جنسیتی و ... که به تفکیک جنسیت نیاز دارد موردتوجه قرار نگرفته است. ازآنجایی‌که حساسیت در مورد عملکرد سیستم‌های هوش مصنوعی در این مکان های خاص بسیار بالاست بنابراین میزان خطا در این سیستم‌ها باید به حداقل برسد. ما در این پروژه روش‌هایی که تاکنون به‌منظور تشخیص جنسیت از روی صدا و چهره مورداستفاده قرارگرفته است را بررسی کردیم و درنهایت از روشی که دارای سرعت خوب و دقت قابل باشد استفاده کردیم. ما در این پژوهش به‌منظور پردازش صوت ویژگی‌های فرکانس صدا ، فرکانس اساسی صدا و فرکانس غالب صدا را استخراج کردیم، سپس این ویژگی‌ها را با الگوریتم شبکه عصبی مصنوعی آموزش دادیم. نتایج این پژوهش نشان داد که دقت پیش‌بینی جنسیت از روی صدا در حدود 99% است. همچنین به‌منظور پردازش تصویر از شبکه‌های عصبی کانولوشن عمیق با عمق کم و تعداد کمتر نورون‌ها (افزایش سرعت و کاهش محاسبات) استفاده کردیم. در ادامه به‌منظور اطمینان بیش‌تر از شبکه مورداستفاده و اینکه آیا شبکه‌های با عمق بیش‌تر تا چه حد می‌توانند باعث بهبود دقت سیستم شوند تصاویر را با شبکه alexnet آموزش دادیم. نتایج این بررسی نشان داد که هر دو شبکه دقتی در حدود 86% داشتند و باید گفت با توجه به نزدیک بودن دقت پیش‌بینی این دو شبکه به یکدیگر استفاده از شبکه با عمق کمتر به دلیل کاهش محاسبات و افزایش سرعت منطقی‌تر به نظر می‌رسد.. درنهایت با استفاده از الگوریتم ترتیبی (استفاده از صوت و چهره به‌صورت مکمل) میزان دقت در تشخیص این سیستم‌ها را بالاتر بردیم. نتایج این پژوهش نشان داد که می‌توان با استفاده از سیگنال‌های صوت و چهره انسان به‌صورت الگوریتم ترتیبی میزان خطا در سیستم طراحی‌شده را کاهش داد.
کلیدواژه کلاسبندی جنسیت، شبکه های عصبی کانولوشن عمیق، اندازهگیری ویژگیهای آکوستیک، پردازش صدا، پردازش تصویر
آدرس , iran, , iran
پست الکترونیکی amir.khandani@outlook.com
 
   designing a user gender recognition system using the features of human voice and face signals  
   
Authors
  
 
 

Copyright 2023
Islamic World Science Citation Center
All Rights Reserved