九游娱乐体育app-李四做交易 通过近期山西“牛市”看电力交易数据研究路径

2024-09-02 发布者:九游娱乐体育集团

自2024年5月中旬起,平静许久的山西电力市场终于迎来了一波“牛市”,5.16-5.31平均日前价格393.31元/MWh,较5.1—5.15日平均日前价格283.49元/MWh,半月实现环比增长38.74%。事后来看,本轮走势叠加了高温、高煤价、线路检修、火电开机不足等多重原因,但从市场主体利益角度出发,如果对于这样看似“偶发”的事件抗风险能力不足,必然会承受不小的损失。学费交了,得到的经验不能仅仅归结于”黑天鹅“事件,还是要从偶然中寻找必然:除了漫天飞舞的市场信息,本轮高价是否有迹可循?本文尝试从数据角度分析本轮山西市场的高价。

(来源:兰木达电力现货 作者:姜宏强)

首先,通过边界条件对比可以发现,5月下半月新能源出力几乎没有变化,日前负荷预测、联络线计划均增加,导致日前竞价空间增加近200万MW,开机容量增加近110万。由此来看,负荷增长是本轮增长的最主要原因,外送增长,开机不足是次要原因。事后诸葛亮总是无趣的,我们还是要把时间拨回5月15日,看看在那个时间点,我们能发现些什么?这里我们构造一个虚拟人物:在山西电力市场有一年交易经验的交易员李四。

0.png

表1山西电力市场2024年5月下半月较上半月边界条件变化

负荷增长是可预测的吗?

山西自2021年4月1日开启连续试运行以来已三年有余,通过历史数据研究,考虑负荷的周期性、趋势增长以及近期波动,利用2021.4.1-2024.5.15日的实际用电数据对2024.5.16-2024.5.31来做预测(这里假设负荷预测等于实际用电):

2.png

图1.1 利用时间序列方法(SARIMA)的负荷预测结果与实际用电对比

预测结果与实际结果的平均误差为-131.24万千瓦,说明模型也受到了5月上半月负荷“低迷“的影响。可以看到,即使李四用到的模型,提取了历史数据中周期性、趋势性以及近期的波动性,预测结果仍然和实际结果产生了较大的偏差,说明本轮高价,并不能怪市场主体没有好好对历史数据研究,因为有限的历史样本中,确实没有遇到过这种情况。通过图1.2也可以看出,2024年的负荷水平确实是历史最高的一年,较为接近的是2022年,但跨过2023年去利用2022的数据,似乎不太符合直觉。

3.png

图1.2 山西电力市场2021年-2024年5月下半月负荷对比

历史数据的研究价值看来是有限的,研究陷入了僵局。但经常看气象报道的李四回想起近期看到的新闻:2024年4月又是全球有记录以来的“最热4月“。既然天气预报总是有的,能不能把气温的影响考虑进来呢?李四尝试在上一个模型中加入温度数据,由于数据原因,从2022.1.20开始分析,考虑历史负荷数据与历史温度情况,来做第二次预测:

4.png

图1.3 利用时间序列方法(ARIMAX)的负荷预测结果与实际用电对比

考虑温度之后,预测结果与实际结果的缩小到了-89.70万千瓦,误差进一步缩小。结合第一次预测的结果,李四已然受到了启发:通过第一轮预测并没有从趋势上发现负荷增长的迹象,那么本轮增长的动因应该更多和温度相关,应该着重考虑温度对气象负荷的影响。而在历史数据的分析中,温度和负荷的影响又是复杂的,只有高温和低温的影响对用电负荷的影响是显著的,夏季只需要关注高温和负荷的影响关系即可,不需要引入过多的数据影响预测结果(比如冬季温度和负荷的关系就是相反的)。本轮天气预报的平均气温超过了20℃,筛选历史中的温度高于20℃的样本,李四发现温度和负荷的相关性高达70.15%!即使用最简单的线性回归模型来做预测,也可以得到较好的结果。

1.4.png

图1.4 利用温度-负荷线性回归的负荷预测结果与实际用电对比

第三次预测的结果误差已然缩小至-14.64万千瓦,负荷预测的工作暂时可以告一段落:本轮负荷上涨的主要原因是高温的影响,而历史上5月并未出现过类似的天气,这似乎也很容易解释,在全球气候变暖的大背景下,每年的气候都是“新的一年“。在本轮行情中,关注到了异常温度的李四在负荷预测工作上取得了较好的成绩。

其他的边界条件

经过了山西市场的多次“教育“,李四已经学会看气象预测了:结合新能源场站的预测以及全省范围的气象预测,5月下旬的新能源在预测结果上并没有产生太大的波动,新能源的预测偏差相对较小,几乎可以忽略不计。换言之,接近6月份,新能源的影响已经越来越弱,在新能源预测工作上,李四也顺利完成。

2.1.png

图2.1 基于某气象数据源的新能源预测与新能源实际出力对比

而在进行外送预估时,李四考虑到了省间中长期是物理交割,且上旬由于劳动节假期的影响,下半月的外送会相对较高一些,李四利用了上旬非节假日期间的日前联络线计划做预估,最后的误差影响也控制在了30万千瓦以内。

最后,李四在进行开机容量预估,考虑年度机组检修情况及历史开机情况,预计开机容量在3500万左右。至此,市场的主要边界条件的预测工作,李四都有惊无险的顺利完成。

最后的工作与反思

李四整理了一下自己的需求预测结果,总体来看,较上半月,负荷预计增长120万左右,外送预计增长30万左右,总需求预计增加了150万,新能源预测和上半月接近持平。然后,需求分析结束后,在进行供给分析时,李四却犯了难,150万能带来多大的增长?火电开机能不能跟得上?李四敏锐的意识到,上半月晚高峰8、9点的平均负荷率已经达到了86%,如果下半月继续仍持在该水平,平均开机容量至少要增加170万左右,达到3500万,最大开机容量要增加350万左右,达到3700万,李四对这个数字不太乐观,但觉得似乎也能达到。纠结许久,最后李四预估平均开机容量增加100万左右,供给相对上半月略紧张,在上半月的供给曲线基础上做了略微调整,给出了自己的供给曲线预测以及价格预测。

3.1.png

图3.1 5.16-5.31负荷率-日前价格散点图与预测数据对比

遗憾的是,李四最终的预测结果为304.48元/MWh,较实际的日前价格393.31元/MWh仍然存在很大的偏差。原因在于对于煤电机组的报价行为预估上,低估了在高负荷率时段报价的影响。聪明而又勤奋的李四做了许多的数据工作,但为山九仞,功亏一篑,事后李四不免有些懊悔,他觉得自己本该想到,在高温高负荷的背景下,晚高峰的价格容易出现骤升;又想起了近期关于动力煤价格持续走高,某省内重要通道与省间通道检修的通知;以及很早以前听到其他人提起过的容量电价考核对火电出力上限的影响等等。但想到最后,李四也想开了些,这些因素事前即使全部考虑到,自己也没有办法量化其影响。

实际上,即使站在事后复盘的角度,我们也能体会李四的难处。在供需紧张的时期,供给端的市场主体行为往往呈现自我实现、螺旋上升的特点,每天的曲线相比于前一天都是渐进向上的,动态的,这很难通过事前演绎推理的方式进行判断。此外,本轮高价中间还存在着煤价、煤质、节点阻塞、容量电价考核等的短期不可量化的影响。供给行为的预估偏差是李四本次预测偏差的主要来源。此外,李四也发现,在前面的递进式的推理当中,负荷、新能源、外送、开机等边界条件每一步的预测误差实际都会相互影响,最后的需求估计是直接忽略这种影响的,这也是不符合实际的。这也是在预测过程中,李四感觉通过因果推断难度越来越大的原因。

分析至此,李四并没有怀疑和动摇自己的通过数据驱动去进行电力市场研究的路径,反而踌躇满志地准备尝试下一步研究:直接利用温度、检修机组容量去做预测,忽略中间环节的影响,直接探寻外部变量与预测目标之间的相关性。

故事尚未结束

李四的故事暂时结束了,但电力体制改革的故事还远未结束,并且正在逐渐成为最主流的话题。通过李四做交易的故事,我们可以看到数据挖掘的价值,通过历史数据分析可以找到温度和负荷的关系,实际上也能依此对市场主体行为进行建模,其难度在于非结构化的交易行为应该如何表示,并不在数据本身;也可以看到基于经济学模型的演绎推理方式的局限性,虽然经济模型的解释效����果比较好,但其大量的简化与假设往往会和实际复杂的电力系统输出的结果产生偏差。

随着电力市场的逐步发展,数据的价值将会进一步体现,数据的研究路径也会走向多样化,数据驱动的业务场景也会越来越多。长远来看,好的改革一定是自上而下和自下而上结合的,想要更多市场主体参与,实现对价格信号的有效响应,市场消息不可能是信号枪或指挥棒,只有让数据说真话,依数据而行,才能让决策更客观、市场更高效。

因时间原因,导致以上分析并不一定严谨,有不足之处产生误导,还请批评指正。同时,本文旨在通过近期这一异动情况指出电力市场的复杂性与波动特征,以及通过数据型的交易路线研究的思路,在市场信息方面并未深入调查。

-九游娱乐体育官网