|
|
تخصیص منابع مبتنی بر یادگیری تقویتی برای بهبود گذردهی در ارتباطات d2d سلولی
|
|
|
|
|
نویسنده
|
حکمی وصال ,مصطفوی اکبر ,عارفی نژاد زیبا
|
منبع
|
مهندسي برق دانشگاه تبريز - 1399 - دوره : 50 - شماره : 3 - صفحه:1165 -1177
|
چکیده
|
با توجه به تقاضای روزافزون برای پهنای باند شبکههای سلولی، همزیستی ارتباطات دستگاه به دستگاه با مشترکان مجوزدار شبکه سلولی میتواند به بهرهوری کارآمد از طیف مغناطیسی منجر شده و گذردهی شبکه را افزایش دهد. در این شیوه، منابع به نحوی میان مشترکان مجوزدار شبکه سلولی و زوج دستگاهها با ارتباط مستقیم به اشتراک گذاشته میشود که ضمن افزایش بهرهوری طیف فرکانسی، خللی در کیفیت سرویس کاربران مجوزدار ایجاد نشود. اغلب روشهای تخصیص منابع کنونی متکی به اطلاعات وضعیت کانال و بازخورد نرخ ارسال مشترکان شبکه سلولی هستند که این اطلاعات به شکل دقیق در دسترس نیست. در این مقاله، یک روش نوآورانه مبتنی بر یادگیری تقویتی برای تنظیم حالت کاری کاربران d2d و اختصاص طیف به گرهها پیشنهاد میشود که بدون نیاز به اطلاعات وضعیت کانال، منابع به شکل بهینه بین کاربران ارتباطات d2d و مشترکان شبکه سلولی تقسیم شده و گذردهی شبکه را بیشینه میسازد. ارزیابیهای انجام شده نشان میدهد که روش پیشنهادی علیرغم عدم دسترسی به اطلاعات وضعیت کانال و بازخورد نرخ ارسال مشترکان، به گذردهی نزدیک به حالت بهینه دست مییابد و نرخ قطعی آن بسیار نزدیک به حالت ایده آل است.
|
کلیدواژه
|
ارتباطات d2d، اطلاعات وضعیت کانال، تخصیص طیف فرکانسی، یادگیری تقویتی
|
آدرس
|
دانشگاه علم و صنعت ایران, دانشکده مهندسی کامپیوتر, ایران, دانشگاه یزد, گروه مهندسی کامپیوتر, ایران, دانشگاه علم و صنعت ایران, دانشکده مهندسی کامپیوتر, ایران
|
پست الکترونیکی
|
z_arefinezhad@comp.iust.ac.ir
|
|
|
|
|
|
|
|
|
RL-based Resource Allocation for Improving Throughput in Cellular D2D Communications
|
|
|
Authors
|
Hakami V. ,Mostafavi S. A. ,Arefinezhad Z.
|
Abstract
|
With increasing demand of bandwidthintensive application in cellular networks, coexistence of DevicetoDevice (D2D) communications with cellular subscribers is a promising solution for high spectrum efficiency and network throughput. In cellular D2D communications, intelligent resource sharing among the network subscribers and paired devices is of significant importance. The most stateoftheart works are relied on the exact values of Channel State Information (CSI) and subscribers’ transmission rate feedback which are not available in the real cases. In this paper, we propose a novel reinforcementlearningbased approach for mode selection and spectrum allocation called RLD2D which shares efficiently resources amongst the D2D users and cellular subscribers with the need for CSI, achieving high network throughput. The results of evaluations show that RLD2D achieves nearoptimal performance and low outage rate in despite of lack of CSI and users’ transmission rate feedback.
|
Keywords
|
|
|
|
|
|
|
|
|
|
|
|