تخصیص منابع مبتنی بر یادگیری تقویتی برای بهبود گذردهی در ارتباطات d2d سلولی

Fa | Ar | En

تخصیص منابع مبتنی بر یادگیری تقویتی برای بهبود گذردهی در ارتباطات d2d سلولی


نویسنده	حکمی وصال ,مصطفوی اکبر ,عارفی نژاد زیبا
منبع	مهندسي برق دانشگاه تبريز - 1399 - دوره : 50 - شماره : 3 - صفحه:1165 -1177
چکیده	با توجه به تقاضای روزافزون برای پهنای باند شبکه‌های سلولی، همزیستی ارتباطات دستگاه به دستگاه با مشترکان مجوزدار شبکه سلولی می‌تواند به بهره‌وری کارآمد از طیف مغناطیسی منجر شده و گذردهی شبکه را افزایش دهد. در این شیوه، منابع به نحوی میان مشترکان مجوزدار شبکه سلولی و زوج دستگاه‌ها با ارتباط مستقیم به اشتراک گذاشته می‌شود که ضمن افزایش بهره‌وری طیف فرکانسی، خللی در کیفیت سرویس کاربران مجوزدار ایجاد نشود. اغلب روش‌های تخصیص منابع کنونی متکی به اطلاعات وضعیت کانال و بازخورد نرخ ارسال مشترکان شبکه سلولی هستند که این اطلاعات به شکل دقیق در دسترس نیست. در این مقاله، یک روش نوآورانه مبتنی بر یادگیری تقویتی برای تنظیم حالت کاری کاربران d2d و اختصاص طیف به گره‌ها پیشنهاد می‌شود که بدون نیاز به اطلاعات وضعیت کانال، منابع به شکل بهینه بین کاربران ارتباطات d2d و مشترکان شبکه سلولی تقسیم شده و گذردهی شبکه را بیشینه می‌سازد. ارزیابی‌های انجام شده نشان می‌دهد که روش پیشنهادی علیرغم عدم دسترسی به اطلاعات وضعیت کانال و بازخورد نرخ ارسال مشترکان، به گذردهی نزدیک به حالت بهینه دست می‌یابد و نرخ قطعی آن بسیار نزدیک به حالت ایده آل است.
کلیدواژه	ارتباطات d2d، اطلاعات وضعیت کانال، تخصیص طیف فرکانسی، یادگیری تقویتی
آدرس	دانشگاه علم و صنعت ایران, دانشکده مهندسی کامپیوتر, ایران, دانشگاه یزد, گروه مهندسی کامپیوتر, ایران, دانشگاه علم و صنعت ایران, دانشکده مهندسی کامپیوتر, ایران
پست الکترونیکی	z_arefinezhad@comp.iust.ac.ir

RL-based Resource Allocation for Improving Throughput in Cellular D2D Communications

Authors	Hakami V. ,Mostafavi S. A. ,Arefinezhad Z.
Abstract	With increasing demand of bandwidthintensive application in cellular networks, coexistence of DevicetoDevice (D2D) communications with cellular subscribers is a promising solution for high spectrum efficiency and network throughput. In cellular D2D communications, intelligent resource sharing among the network subscribers and paired devices is of significant importance. The most stateoftheart works are relied on the exact values of Channel State Information (CSI) and subscribers’ transmission rate feedback which are not available in the real cases. In this paper, we propose a novel reinforcementlearningbased approach for mode selection and spectrum allocation called RLD2D which shares efficiently resources amongst the D2D users and cellular subscribers with the need for CSI, achieving high network throughput. The results of evaluations show that RLD2D achieves nearoptimal performance and low outage rate in despite of lack of CSI and users’ transmission rate feedback.
Keywords