بهینهسازی عملکرد مدار مجتمع قابل بازپیکربندی برای پیادهسازی شبکههای عصبی عمیق
|
|
|
|
|
نویسنده
|
میرجوادی مانی ,امینیان مهدی
|
منبع
|
اولين كنفرانس بين المللي و ششمين كنفرانس ملي كامپيوتر، فناوري اطلاعات و كاربردهاي هوش مصنوعي - 1401 - دوره : 1 - اولین کنفرانس بین المللی و ششمین کنفرانس ملی کامپیوتر، فناوری اطلاعات و کاربردهای هوش مصنوعی - کد همایش: 01220-12911 - صفحه:0 -0
|
چکیده
|
استفاده از شبکههای عصبی عمیق روز به روز در حال افزایش است و هر روز کاربردهای بیشتری از آن مورد استفاده محققین قرار میگیرد. از طرفی پیادهسازی بهینه شبکههای عصبی عمیق روی سختافزارها همیشه یکی از دغدغههای مهم محققین بوده. چرا که آنها میخواهند تمرکز خود را روی فریمورکهای سطح بالایی همچون تنسورفلوها قرار دهند و با استفاده از زبانهای سطح بالا مدلهای خود را طراحی کنند و درگیر پیادهسازیهای سختافزاری دشوار نشوند. یکی از اصلیترین سختافزارها در کنار کارتهای گرافیک و پردازندههای asic برای پیادهسازی مدلهای شبکههای عصبی عمیق، fpga ها هستند چرا که قابل بازپیکربندی بودنشان گزینههای بهینهسازی زیادی را در اختیارمان قرار میدهد. در پژوهش پیش رو کامپایلری ارائه میشود که به طور خودکار میتواند مدلهای شبکههای عصبی عمیق را از فریمورکهای سطح بالایی همچون تنسورفلو دریافت کند و آنها را به صورت بهینه روی fpga ها پیادهسازی نماید. در این پژوهش، ابتدا به فضاهایی که میتوان آنها را بهبود داد اشاره میشود و سپس روند کلی کامپایلر تشریح خواهد شد. در نهایت مشاهده میکنیم که نتایج کامپایلر ارائه شده میتواند با ابزارهای تجاری موجود در بازار رقابت کند.
|
کلیدواژه
|
شبکههای عصبی عمیق، یادگیری ماشین، مدارهای مجتمع قابل بازپیکربندی، fpga
|
آدرس
|
, iran, , iran
|
|
|
|
|
|
|