|
|
مدل رمزگذاری میدان تاثیر برای بینایی طبیعی دینامیکی
|
|
|
|
|
نویسنده
|
کمالی فاطمه ,صورتگر امیرابوالفضل ,منهاج محمدباقر ,عباسی اصل رضا
|
منبع
|
علوم اعصاب شفاي خاتم - 1398 - دوره : 7 - شماره : 4 - صفحه:1 -7
|
چکیده
|
مقدمه: مدلهای رمزگذاری برای پیشبینی فعالیت مغز انسان در پاسخ به محرکهای حسی مورد استفاده قرار میگیرند. هدف این مدلها توضیح دادن نحوه ارائه اطلاعات حسی در مغز است. شبکههای عصبی کانولوشنی که به وسیله تصاویر آموزش دیدهاند قادر به رمزگشایی دادههای تصویربرداری رزونانس مغناطیس عملکردی از انسانها در حال مشاهده تصاویر طبیعی هستند. با در نظر گرفتن تابع پاسخ همودینامیک، این شبکهها بدون داشتن هیچ مکانیسم بازگشتی یا پسخور قادر به تخمین میزان اکسیژن خون وابسته به سطح برای تصاویر ویدیویی نیز هستند. برای این منظور از نقشههای ویژگی استخراج شده از شبکه عصبی کانولوشن و مفهوم میدان تاثیر در مدل رمزگذاری استفاده شده است. فرض اصلی در این مدل این است که برای هر واکسل یک منطقه مکانی در نقشه ویژگی کدگذاری میشود و این مناطق برای همه نقشههای ویژگی ثابت است. سهم هر نقشه ویژگی در فعالیت واکسل از طریق وزن مربوطه مشخص میشود. مواد و روشها: در این پژوهش سه داوطلب سالم در حال تماشای مجموعهای از تصاویر ویدیویی هستند. این مجموعه حاوی تصاویری است که نمایانگر بینایی طبیعی در زندگی واقعی است. دادههای ام آر آی و اف ام آر آی با استفاده از کویلهای سطحی ارایه فازی 3 تسلا سیستم ام آر آی گرفته شده است. یافتهها: دادهها نشان داد که قشر بینایی انسان دارای ساختاری سلسله مراتبی است. نواحی دیداری اولیه دارای میدان تاثیر کوچکتری هستند و به ویژگیهای ساده مثل لبه پاسخ میدهند، در حالی که نواحی دیداری سطح بالاتر دارای میدان تاثیر بزرگتری بوده و به ویژگیهای پیچیدهتر مانند الگو پاسخ میدهند. نتیجهگیری: این مدل برای تصاویر ویدیویی ظرفیت تفسیرپذیری بالاتری را نسبت به مدلهای پیشین دارد.
|
کلیدواژه
|
تصویر برداری رزونانس مغناطیسی، قشر بینایی، مغز
|
آدرس
|
دانشگاه صنعتی امیرکبیر, دانشکده مهندسی برق, ایران, دانشگاه صنعتی امیرکبیر, دانشکده مهندسی برق, ایران, دانشگاه صنعتی امیرکبیر, دانشکده مهندسی برق, ایران, دانشگاه کالیفرنیا, دانشکده نورولوژی, آمریکا
|
|
|
|
|
|
|
|
|
|
|
Receptive Field Encoding Model for Dynamic Natural Vision
|
|
|
Authors
|
Kamali Fatemeh ,Suratgar Amir Abolfazl ,Menhaj Mohamad Bagher ,Abbasi Asl Reza
|
Abstract
|
Introduction: Encoding models are used to predict human brain activity in response to sensory stimuli. The purpose of these models is to explain how sensory information represent in the brain. Convolutional neural networks trained by images are capable of encoding magnetic resonance imaging data of humans viewing natural images. Considering the hemodynamic response function, these networks are capable of estimating the blood oxygen level dependence of subject viewing videos without any recurrence or feedback mechanism. For this purpose, feature map extracted from the convolutional neural network and the concept of receptive field has been used for the encoding model. The main assumption of this model is that activity in each voxel encodes a spatially localized region across multiple feature maps and for each voxel and this area are fixed for all feature maps. Contribution of each feature map in the activity of each voxel is determined by the corresponding weight. Materials and Methods: In this study, three healthy volunteers watching a set of videos. This collection contains images that represent reallife visual experience. MRI and fMRI data are acquired on a 3 tesla MRI system phasearray surface coil. Results: Data revealed that human visual cortex has hierarchical structure. Earlier visual areas have a smaller receptive field size in and response to simple feature like edge, whereas higher visual areas have a larger receptive field size and response to more complex features, such as pattern. Conclusion: This model of video stimuli has a higher interpretation capacity than the previous models.
|
Keywords
|
Magnetic Resonance Imaging ,Visual Cortex ,Brain
|
|
|
|
|
|
|
|
|
|
|