>
Fa   |   Ar   |   En
   مدل رمزگذاری میدان تاثیر برای بینایی طبیعی دینامیکی  
   
نویسنده کمالی فاطمه ,صورتگر امیرابوالفضل ,منهاج محمدباقر ,عباسی اصل رضا
منبع علوم اعصاب شفاي خاتم - 1398 - دوره : 7 - شماره : 4 - صفحه:1 -7
چکیده    مقدمه: مدل‌های رمزگذاری برای پیش‌بینی فعالیت مغز انسان در پاسخ به محرک‌های حسی مورد استفاده قرار می‌گیرند. هدف این مدل‌ها توضیح دادن نحوه ارائه اطلاعات حسی در مغز است. شبکه‌های عصبی کانولوشنی که به وسیله تصاویر آموزش دیده‌اند قادر به رمزگشایی داده‌های تصویربرداری رزونانس مغناطیس عملکردی از انسان‌ها در حال مشاهده تصاویر طبیعی هستند. با در نظر گرفتن تابع پاسخ همودینامیک، این شبکه‌ها بدون داشتن هیچ مکانیسم بازگشتی یا پسخور قادر به تخمین میزان اکسیژن خون وابسته به سطح برای تصاویر ویدیویی نیز هستند. برای این منظور از نقشه‌های ویژگی استخراج شده از شبکه عصبی کانولوشن و مفهوم میدان تاثیر در مدل رمزگذاری استفاده شده است. فرض اصلی در این مدل این است که برای هر واکسل یک منطقه مکانی در نقشه ویژگی کدگذاری می‌شود و این مناطق برای همه نقشه‌های ویژگی ثابت است. سهم هر نقشه ویژگی در فعالیت واکسل از طریق وزن مربوطه مشخص می‌شود. مواد و روش‌ها: در این پژوهش سه داوطلب سالم در حال تماشای مجموعه‌ای از تصاویر ویدیویی هستند. این مجموعه حاوی تصاویری است که نمایانگر بینایی طبیعی در زندگی واقعی است. داده‌های ام آر آی و اف ام آر آی با استفاده از کویل‌های سطحی ارایه فازی 3 تسلا سیستم ام آر آی گرفته شده است. یافته‌ها: داده‌ها نشان داد که قشر بینایی انسان دارای ساختاری سلسله مراتبی است. نواحی دیداری اولیه دارای میدان تاثیر کوچک‌تری هستند و به ویژگی‌های ساده مثل لبه پاسخ می‌دهند، در حالی ‌که نواحی دیداری سطح بالاتر دارای میدان تاثیر بزرگ‌تری بوده و به ویژگی‌های پیچیده‌تر مانند الگو پاسخ می‌دهند. نتیجه‌گیری: این مدل برای تصاویر ویدیویی ظرفیت تفسیرپذیری بالاتری را نسبت به مدل‌های پیشین دارد.
کلیدواژه تصویر برداری رزونانس مغناطیسی، قشر بینایی، مغز
آدرس دانشگاه صنعتی امیرکبیر, دانشکده مهندسی برق, ایران, دانشگاه صنعتی امیرکبیر, دانشکده مهندسی برق, ایران, دانشگاه صنعتی امیرکبیر, دانشکده مهندسی برق, ایران, دانشگاه کالیفرنیا, دانشکده نورولوژی, آمریکا
 
   Receptive Field Encoding Model for Dynamic Natural Vision  
   
Authors Kamali Fatemeh ,Suratgar Amir Abolfazl ,Menhaj Mohamad Bagher ,Abbasi Asl Reza
Abstract    Introduction: Encoding models are used to predict human brain activity in response to sensory stimuli. The purpose of these models is to explain how sensory information represent in the brain. Convolutional neural networks trained by images are capable of encoding magnetic resonance imaging data of humans viewing natural images. Considering the hemodynamic response function, these networks are capable of estimating the blood oxygen level dependence of subject viewing videos without any recurrence or feedback mechanism. For this purpose, feature map extracted from the convolutional neural network and the concept of receptive field has been used for the encoding model. The main assumption of this model is that activity in each voxel encodes a spatially localized region across multiple feature maps and for each voxel and this area are fixed for all feature maps. Contribution of each feature map in the activity of each voxel is determined by the corresponding weight. Materials and Methods: In this study, three healthy volunteers watching a set of videos. This collection contains images that represent reallife visual experience. MRI and fMRI data are acquired on a 3 tesla MRI system phasearray surface coil. Results: Data revealed that human visual cortex has hierarchical structure. Earlier visual areas have a smaller receptive field size in and response to simple feature like edge, whereas higher visual areas have a larger receptive field size and response to more complex features, such as pattern. Conclusion: This model of video stimuli has a higher interpretation capacity than the previous models.
Keywords Magnetic Resonance Imaging ,Visual Cortex ,Brain
 
 

Copyright 2023
Islamic World Science Citation Center
All Rights Reserved