|
|
شبیهسازی مبتنی بر عامل بازار برق ایران بر اساس عاملهای یادگیرندهی ریسکگریز با استفاده از یادگیری تقویتی و سنجهی ارزش در معرض خطر شرطی (مطالعهی کاربردی: بازار برق استان یزد)
|
|
|
|
|
نویسنده
|
زارع مهرجردی یحیی ,رضایی صدرآبادی محمد حسین ,اولیاء محمد صالح ,وحدت زاد محمد علی
|
منبع
|
مهندسي صنايع و مديريت شريف - 1400 - دوره : 37-1 - شماره : 2 - صفحه:67 -78
|
چکیده
|
در این پژوهش فرایند حراج بازار برق ایران با استفاده از یک مدل مبتنی بر عامل بر اساس روش یادگیری تقویتی کیو، با در نظر گرفتن رفتار ریسکگریزی نیروگاهها شبیهسازی شده است. در این شبیهسازی شرکتهای تولیدکنندهی برق مبتنی بر یک فرایند یادگیری از نتایج ماحصل از قیمت دهیهای پیشین، قیمتهای پیشنهادی خود را بهینه کردهاند. رفتار ریسکگریزی شرکتهای تولیدکنندهی برق بر اساس سنجهی ارزش در معرض خطر شرطی و ریسک فرصت از دست رفته بر اساس تعداد شکستها در حراج مدلسازی شده است. برای ارزیابی رویکرد پیشنهادی، از دادههای واقعی بازار برق استان یزد شامل پنج نیروگاه استفاده شده و نتایج به دست آمده در شرایط مختلف یادگیری، رفتارهای ریسکی شرکتها و سیستمهای تسویهی پرداخت بر اساس پیشنهاد و پرداخت یکنواخت مقایسه شده است. نتایج این تحقیق نشان داده است که یادگیری همهی نیروگاهها میتواند منجر به افزایش رقابت میان آنها و در نتیجه افزایش رفاه اجتماعی شود.
|
کلیدواژه
|
بهینهسازی استراتژی قیمت دهی، یادگیری تقویتی، یادگیری کیو، ارزش در معرض خطر شرطی، ریسک فرصت از دست رفته
|
آدرس
|
دانشگاه یزد, دانشکده مهندسی صنایع, ایران, دانشگاه یزد, دانشکده مهندسی صنایع, ایران, دانشگاه یزد, دانشکده مهندسی صنایع, ایران, دانشگاه یزد, دانشکده مهندسی صنایع, ایران
|
پست الکترونیکی
|
mvahdat@yazd.ac.ir
|
|
|
|
|
|
|
|
|
AGENTBASED SIMULATION OF IRANIAN ELECTRICITY MARKET BASED ON RISK AVERSE LEARNING AGENTS USING REINFORCEMENT LEARNING AND CONDITIONAL VALUE AT
|
|
|
Authors
|
|
Abstract
|
Restructuring and deregulation are one of the most significant developments in the world electricity market. In this market, Generation Companies (GenCos) in an oligopolistic game with incomplete information participate in a sealed auction and offer their bids in a certain period according to the market demand. Choosing the best bid to maximize profits and minimize risks in dynamic competition with other players is one of the most important issues for GenCos. The dynamic nature of this problem can help GenCos make the best decision based on learning from the past. Using reinforcement learning and considering risk aversity of the GenCos, this paper provides an agentbased simulation of the bidding behavior of Iran's electricity market. In this simulation, the GenCos optimize their bids using a learning process based on previous bids. Although a few studies have been conducted on the modeling of riskaverse behavior of GenCos under learning conditions, riskaverse analysis based on a history of profits and losses, or sever losses, has not been focused. Thus, in this paper, the learning behavior of the GenCos is modeled by the Qlearning reinforcement learning algorithm and their risk aversion behavior is modeled by the conditional value at risk measure and risk of missed opportunities in terms of the number of auction failures (missed auction opportunities). To validate the functionality of the proposed approach, it was applied to the real data of the electricity market of Yazd province, including five GenCos with the total nominal power of 2550 MW. The results were compared for different learning conditions, risk behaviors of companies, and pay as bid and uniform pricing. The results demonstrate that learning all GenCos leads to increased competition and promoted social welfare. Also, the level of risk aversion of GenCos and the type of clearing mechanism have a direct effect on the GenCos profitability and social welfare. The results can help power plants determine the bidding strategy in competitive conditions by considering their risk level. Likewise, these results assist regulators in designing market rules in line with the actual behavior of GenCos.
|
Keywords
|
|
|
|
|
|
|
|
|
|
|
|