تخمین حالت سه بعدی انسان از تک تصویر با استفاده از شبکه‌ی عصبی غیرخطی کانولوشنی مبتنی بر اطلاعات شکل

Fa | Ar | En

تخمین حالت سه بعدی انسان از تک تصویر با استفاده از شبکه‌ی عصبی غیرخطی کانولوشنی مبتنی بر اطلاعات شکل


نویسنده	شمسافر فرانک ,ابراهیم نژاد حسین
منبع	سامانه هاي غيرخطي در مهندسي برق - 1397 - دوره : 5 - شماره : 1 - صفحه:83 -103
چکیده	تخمین حالت سه بعدی انسان یکی از مسائل پراهمیت و پرکاربرد در بینایی ماشین است. تخمین حالت انسان، از اسکلت دو بعدی و با استفاده از اطلاعات چندگانه آغاز و طی یک روند تکاملی، به تخمین اسکلت سه بعدی با بهره گیری از حداقل اطلاعات ورودی سوق یافته است. در این مقاله، مسئله ی تخمین حالت سه بعدی انسان با استفاده از اطلاعات یک تصویر رنگی بررسی شده است. روش پیشنهادی جزء آن دسته از روش هایی محسوب می شود که ابتدا حالت دو بعدی را استخراج و سپس، با ارتقاء حالت دو بعدی تخمینی به فضای سه بعدی، حالت سه بعدی پیش بینی می شود. به دلیل آن که در این نوع روش ها، منشاء بیشتر خطاها ناشی از تخمین نادرست حالت دو بعدی است، در این مقاله، با ارائه ی روشی برای تخمین دقیق تری از حالت دو بعدی، خطای کمتری برای حالت سه بعدی به دست آمده است. روش پیشنهادی برای تخمین حالت دو بعدی، از یادگیری عمیق و اطلاعات نقشه ی لبه بهره برده است. به عبارتی دیگر، در این مقاله از ویژگی لبه که یک ویژگی طراحی شده است، برای هدایت یادگیری شبکه ی عصبی عمیق و یادگیری ویژگی ها در راستای هدف تعیین شده، استفاده شده است. آزمایش های انجام شده نشان می دهد که روش پیشنهادی به خطای کمتری در تخمین حالت دو بعدی و متعاقباً، به خطای کمتری در پیش بینی حالت سه بعدی تصاویر پایگاه داده ی human3.6m و humanevai منجر شده است.
کلیدواژه	تخمین حالت انسان، یادگیری عمیق، شبکه‌های عصبی کانولوشنی، نقشه‌ی لبه
آدرس	دانشگاه صنعتی سهند, دانشکده ی مهندسی برق, ایران, دانشگاه صنعتی سهند, دانشکده ی مهندسی برق, ایران
پست الکترونیکی	ebrahimnezhad@sut.ac.ir

Three-Dimensional Human Pose Estimation from a Single Image Using Non-linear Convolutional Neural Network Based on Shape Information

Authors	shamsafar faranak ,ebrahimnezhad hossein