|
|
|
|
استفاده از الگوریتم یادگیری عمیق کیو جهت طراحی عاملی خود مختار برای معامله در بازار رمزارزها با تمرکز بر رفتار معاملهگران
|
|
|
|
|
|
|
|
نویسنده
|
اسلامی مهرداد ,آقاصرام مهدی ,زارع چاهوکی محمدعلی
|
|
منبع
|
پژوهشهاي نظري و كاربردي هوش ماشيني - 1403 - دوره : 2 - شماره : 2 - صفحه:49 -65
|
|
چکیده
|
بازار رمزارزها، محیطی پیچیده، غیرقطعی و همراه با نوسان های زیادی است. ایجاد استراتژی معاملاتی در این بازار بسیار چالشبرانگیز است. در این مقاله تاثیر رفتار معاملهگران (معاملاتی که انجام میدهند) بر تغییر شرایط بازار بررسیشده است. عوامل بسیاری در تغییر شرایط بازار تاثیر دارند، اما درنهایت این تاثیرات، از طریق رفتار معاملهگران به فعلیت میرسد. در این مقاله عاملی خودمختار جهت انجام معامله در بازار رمزارز طراحیشده است. عاملی که تنها با بررسی معاملات انجامشده تصمیم میگیرد. طراحی عامل مبتنی بر الگوریتم ddqn از یادگیری تقویتی است. برای آموزش عامل تمام معاملههای انجامشده در صرافی رمزارز hitbtc در طول نزدیک به 3 ماه برای 3 جفت رمزارز، گردآوریشده است. نتایج پیادهسازی نشان میدهد مدل همگرا شده و در شرایط محیطی با ریسک بالا پایداری خوبی از خود نشان داده است. درنتیجه معاملههای انجامشده منبع مهمی برای تصمیمگیری است. ترکیب این روش با روشهای پیشبینی قیمت میتواند رویکردی جدید در طراحی عامل های معاملهگر باشد.
|
|
کلیدواژه
|
عامل معاملهگر هوشمند، رفتار معاملهگران، بازار رمزارزها، یادگیری تقویتی عمیق، الگوریتم dqn
|
|
آدرس
|
دانشگاه یزد, دانشکده مهندسی کامپیوتر, ایران, دانشگاه یزد, دانشکده مهندسی کامپیوتر, ایران, دانشگاه یزد, دانشکده مهندسی کامپیوتر, ایران
|
|
پست الکترونیکی
|
chahooki@yazd.ac.ir
|
|
|
|
|
|
|
|
|
|
|
|
|
using deep q network to develop an autonomous agent for trading in the cryptocurrency market, focusing on traders’ behavior
|
|
|
|
|
Authors
|
eslami mehrdad ,agha sarram mehdi ,zare chahoki mohamad ali
|
|
Abstract
|
crypto currency market is a complex, uncertain and dynamic environment with significant volatility. developing a trading strategy in this market is highly challenging and a key area of academic research. in this article, an autonomous trading agent has been designed to analyze the effects of traders’ behavior (transactions they do) on changing market conditions. although many factors influence the market, these effects impact ultimately through traders behaviors. in this article, the agent makes decisions only by reviewing and analyzing the transactions which has been done by traders. the agent is built using ddqn reinforcement learning algorithm. to train the agent, all hitbtc`s transactions during nearly 3 months for 3 cryptocurrency pairs have been gathered. the results show that the model converges and is stable. as a result, the transactions data are important source for decision making. combining this method with price prediction methods can be a new approach in designing trader agents.
|
|
Keywords
|
autonomous trading agent ,deep reinforcement learning ,trades behaviors ,deep q network
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|