赞
踩
本文干了这几件事:
预测在能源行业的业务决策中很重要,比如预测负荷、发电量和价格等等,这些预测会被用在能源行业的规划和运营中。
专注于围绕电力系统的主题,包括电力需求和价格,以及风能和太阳能发电。尽管石油和天然气预测也是能源预测的一个重要分支领域,但它不在本文的讨论范围之内。
在这篇文章中,检查了子领域之间的共同发展和关注,本文旨在提供一个整体的观点,以促进不同的研究团体之间的合作。
剩余部分的行文组织:
过去几十年有很多能源预测论文发表,本节会重点介绍每个特定领域中一些值得读的论文。
一个多世纪以来,长期负荷预测一直被用于规划目的。空间负荷预测——提供电力需求何时、何地以及增长多少——在20世纪末被大量用于输电和配电规划。
以下几篇论文值得注意:
早期的电价预测论文都致力于短期预测:
风速是风力发电的主要驱动因素:
关于太阳能预测:
工业负荷预测是负荷预测的重要组成部分。虽然文献中有许多可靠的研究,如[21]-[23],但我们还没有看到一篇值得注意的关于这一主题的综述论文。
图1显示了过去10年能源预测文献的增长情况。负荷预测文献占能源预测文献的一半左右。在所有四个子域上都可以观察到增加的趋势。可再生能源预测文献的增长势头强于负荷和价格预测,这在很大程度上归因于近十年来全球可再生能源一体化的努力。
在每个子领域,我们已经挑选了前10个期刊,出版的大多数预测论文的子领域在过去10年。这些期刊被认为是能源预测论文的主要出版渠道。这份榜单总共包括22种期刊,因为有些期刊在多个子领域的发表量排在前10位。在图2中,我们根据能量预测论文占各期刊总发表量的比例对这些期刊进行排序。每个期刊发表的能源预测论文的计数都被标注在期刊的标题旁边,这样感兴趣的读者就可以发现哪个期刊在他们感兴趣的子领域发表的论文最多。一些期刊,比如风工程、太阳能、IEEE可持续能源和能源经济学,主要是致力于一个或两个子域,而其他几个期刊,如国际杂志预测,IEEE电力系统和IEEE智能电网发布一系列能源预测的论文。 在解释这一数字时应谨慎,因为出版数量并不意味着质量。
对于进入该领域的研究者或从业者来说,在建立一个准确的模型或发表自己的论文之前,需要阅读大量的论文和研究。在这个领域有许多出版物。避免把时间浪费在那些在理论和/或实践上没有多大价值的出版作品上是明智的。接下来,我们将概述几个新兴的研究课题。尽管如此,我们澄清这些主题决不是全面的。由于页数的限制,一些新出现的问题在本文中无法涵盖。
预测的基本假设是假定未来在某种程度上与历史有相似的模式或分布。从历史数据中发现模式或隐藏信息是准确预测的关键。人工智能(AI)和机器学习(ML)技术的发展无疑有利于能源预测的发展。事实上,AI/ML技术已经被用于能量预测[24]-[26]超过30年了。
近年来,由于计算技术的进步,人工智能/ML领域正在经历另一场热潮。各种先进的人工智能/ML技术,如深度学习[27],[28],强化学习[29],迁移学习[30],已被用于能量预测。
深度学习的一个缺点是,它的训练过程比回归模型复杂得多,耗时也长得多。要估计的不仅是参数的纯数量(权值),还有超参数(网络结构、激活函数、停止条件、正则化等)[31]的优化。深度学习技术的应用依赖于不断增加的计算能力和收集的数据。
利用外部数据并不意味着简单地将未经处理的天气变量包含到机器学习模型中。相反,人们应该更深入地研究这些数据的内在特性、显著特征和局限性。
组合预测已被广泛认为是预测的最佳实践之一。1969年[32]正式讨论了预测组合的好处。后来发表了许多实证研究,证明了组合预测的积极和消极影响。一些值得注意的评述可以在[33]-[35]中找到。
预测组合策略的成功在能源预测文献中很容易找到:
集成预测的另一种方法是利用数据空间和参数空间来量化与预测模型相关的不确定性。由51个成员组成的ECMWF集合预报系统是迄今为止最好的数值天气预报模式之一。风速和辐照度预报在风力和太阳预报中尤为重要,而温度预报则是负荷预报的重要手段。读者可参阅[44]了解集合天气预报的概述。
能源预测经常遇到时间序列,由于时间或地理分组而具有聚集约束。例如,分布馈线处的负载之和应该等于相应传输处的负载减去损耗,这通常是很小的百分比。在这些场景中,层次预测(协调在层次结构的不同级别单独生成的基本预测)变得很重要。与传统预测相比,分层预测有两个明显的优势。首先,一个层次的最终预测是一致的。换句话说,低水平预测的总和接近或等于相应的高水平预测。其次,调和后的预测往往(如果不是总是)比基本预测更准确。
关于层次预测:
自然界的许多现象和系统都可以被看作随机过程或被模拟。经常使用的点预测或单值预测,只是简单地显示一个主题在不同时期的汇总统计数据,主要是预期值。在天气预报中,人们早就知道预报本质上是五维的,跨越三维空间、时间和概率[53]。为此,进行概率预测从来都不是一种选择,但对预测者对基本主题的理解进行反思是很重要的。读者参阅了关于概率预测[54]的开创性评论。
概率预测可以使用参数、半参数或非参数方法,以概率分布、分位数或区间的形式发布。无论发出哪种形式的概率预测,都可以使用从一种形式转换为另一种形式的方法。此外,用概率预测可以根据[55]中提出的指导方针归纳为点预测。
在最近的能源预测历史上,最重要的一步可能是从确定性的观点过渡到概率的观点。在概率预测方面,风电预测无疑处于领先地位,这在很大程度上可能是由于早期风力预报员和气象学家之间的密切合作。
许多研究人员提出了风能概率预测的替代方法,解释了如何将这些预测作为决策模型的输入,并展示了将自己置于概率框架中的好处:
发展概率负荷预测可以追溯到20世纪70年代的[5]。然而,直到2014年全球能源预测大赛(GEFCom2014)[52],才开始正式采用适当的技能措施进行概率负荷预测。
从系统论的角度来看,点预测系统可以分为三个部分,即输入(如特征)、建模和输出(如预测)。我们可以采用这三部分来构建一个概率预测过程。最近的概率负荷预测文献已经对这三个部分进行了正式的研究:
生成良好概率预测的首要原则是在进行校准后提高清晰度[69]。为此,可以使用各种后处理技术(例如集成模型输出统计数据[70]或预测组合[71])来校准和优化初始预测。话虽如此,尽管其历史悠久,但结合概率预测仍然是一个代表性不足的话题[72]。组合预测分布,分位数和区间的方法也可能有所不同[73]-[75]。在负载预测领域可以找到一些特定示例。研究人员提出了各种预测组合策略,以生成和改进概率负荷预测[37],[76],[77]。其中一项是在[41]中首次提出用于概率价格预测的分位数回归平均法,尤其值得强调,因为它也被证明在概率负荷预测中有效[37],[76]。
在能源预测文献中复制现有的模型和方法不仅对刚刚进入该领域的研究人员是有益的,而且也是进一步推进这一技术状态的必要条件。不幸的是,大多数论文都无法被复制,因为这些数据从未发表过,这就凸显了从行业公开获取数据的重要性。在本节中,我们首先简要地看一看能源预测比赛,它激发了许多重大突破。然后,我们介绍六种有用的能源预测研究数据来源。
预测比赛
文献中第一个著名的能源预测竞赛可以追溯到20世纪90年代初,比赛的重点是提前一天负荷预测,由普吉声电力和照明公司主办。10名参赛者的模型各不相同,有神经网络模型、状态空间模型、多元回归模型等。多元回归模型被认为是14个竞争性模型中表现最好的[78]。
2001年,EUNITE网络组织了一场预测一个月日负荷的比赛,SVM在负荷预测领域闪亮登场,获奖作品主要基于支持向量机(SVM),这是SVM首次成功应用于负荷预测[24]。
在促进可再生研究和识别有效方法的理念驱动下,洪和他的合作者组织了一系列的全球能源预测竞赛。GEFCom2012,gefco-m2014,gefcom2017[51],[52],[52],[81],这些比赛是由IEEE电力和能源协会资助的。《国际预测杂志》(International Journal of Forecasti-ng)是收集描述获奖方法的论文并发表竞赛数据的出版物赞助商。这些比赛涵盖广泛的主题,如电力需求和价格预测、风能和太阳能预测、层次预测和概率预测。
在过去的几年中,越来越多的能源公司开始为各种目的组织预测比赛,比如选择软件供应商和招聘实习学生。其中一些竞赛是为了模拟生产环境中的预测过程而设立的,而另一些则不是。这些比赛的结果,如数据和获胜方法,并没有在学术文献中得到很好的记录。我们也应该认识到,有些比赛在不全面设置的情况下,可能无法区分获胜者。[82]讨论了预测比赛的一些局限性。
经验丰富的研究人员可能会发现许多公共领域的数据来支持他们的研究项目。在此,我们强调了能源预测研究的六个重要数据来源。
与研究论文有关的数据
一些学术期刊鼓励作者提交数据和代码,以促进可重复的研究。除了在期刊上发布代码和数据,一些研究人员可能会将他们的代码上传到公共存储库,如GitHub[84]。有些人选择更进一步,在自由软件环境中开发软件包,例如R项目[85]。
ISO/RTO数据
独立系统运营商(ISOs)和区域传输运营商(RTOs)是另一个经常使用的数据源,尤其是负荷和价格数据。这些ISOs/RTOs发布的数据的长度、种类和质量各不相同。许多ISOs不发布天气信息,而天气信息是负载的重要驱动因素,影响价格。ISO新英格兰是那些使他们的数据档案易于获取的组织之一。因此,它是能源预测案例研究中经常被引用的组织。GEFCom2017的预选赛也使用了ISO新英格兰数据[51]。
智能电表项目
几个著名的智能电表项目已经向科学界发布了有价值的数据集。爱尔兰数据是常用的数据集之一[86]。“Pecan Street”和“Low
Carbon London”是科学文献中另外两个常用的数据来源。最近发表的一篇关于智能电表数据分析的评论已经涵盖了这些数据集,以及其他一些有用的数据集[87],读者可以在那里找到一个更全面的列表。
现场气象资料
对天气变量的现场测量来自地面气象站、浮标和无线电探空仪。经适当的仪器校正后,这些量度是最准确的天气资料。然而,现场数据很少,而且来自自主资源。因此,当为预测目的寻找这些测量值时,质量控制程序必须被放在高度优先的位置。例如,在太阳预报中,基线太阳辐射网(BSRN)和地表辐射预算网(SURFRAD)是两个质量最高的监测网络。这两个数据集都可以使用R中的+SolarD-ata+包[88],[89]来访问。
遥感数据
由于并不是所有地方都可以获得地面测量数据,通过遥感获取的网格化天气数据在天气预报中变得非常重要。这些遥感数据可能来自地球同步气象卫星或极地轨道飞行器上的仪器。在[90]中回顾了用于太阳预报的几个流行的遥感数据库。
数值天气预报和再分析数据
NWP的数据是由国家气象中心生成的,可以在世界各地提供,其中一些是免费的。尽管这些数据集托管在由不同气象机构维护的不同数据服务器上,但只要知道确切的链接,任何具有基本计算机知识的人都可以下载和使用这些数据。再分析是NWP资料的一个特殊情况,它实质上是使用一致同化方案的天气模式的再运行。最近的两次全球再分析是MERRA-2和ERA5,它们都提供了从1980年到现在每小时数以千计的大气变量。请注意,即使NWP数据是有用的输入,它们并不总是现成的,需要一些预处理和重新校准。对于在太阳预报中常用的NWP模型,读者可以参考[91]。这两个再分析的细节见[92]和[93]。
除了这六个重要的数据来源外,还有一些网站为能源预测提供开放数据,促进该领域的研究,如open Power System da-ta[94]和open energy modeling Initiative[95]。
我们还应该认识到,可重复的研究也需要一致的基准过程,如基准模型、评估方法和采取的确切程序。它可能需要一些工作小组、工作小组或协会的努力来制定基准测试的标准。
本篇综述作者是众多精英期刊的编委会成员,接下来将讨论文献中能源预测论文的一些常见问题,接着对发表高质量的论文提出一些建议。
首先,最重要的是,文献中的能源预测模型是使用唯一且有限的数据集进行评估的,例如较短的时间段,一个单一的位置以及从未在其他任何研究中使用过的数据集。 如果可能的话,这使得与文献中较早提出的模型进行比较存在问题。 另一个极端也是如此, 对某些数据集的研究非常好,以至于研究人员可能会使用一些将来的信息来给他们提出的方法带来不公平的优势。
其次,评估指标往往不充分。例如,平均绝对百分比误差(MAPE)用于接近零负荷、零价格或可再生能源发电。有时,作者倾向于选择支持他们所提议的方法的误差度量,但对其他误差度量隐藏了结果。
第三,许多论文避免了直接与经典的、已建立的和最先进的模型进行比较。一个假设的例子可以是提出一个神经网络、小波和粒子群优化的混合模型来预测风力发电,而竞争模型是一个具有任意结构和参数调整不良的神经网络模型。
最后但并非最不重要的是,各篇论文对预测术语的使用不一致,这往往导致对预测模型、方法和过程的含糊描述。有时,一个新术语被发明出来,使提议的想法看起来很新奇。这种做法通常会让文章在搜索引擎中很难被注意到,除非这个想法是真正具有开创性的,这使得这个新发明的术语得到广泛认可。
为了帮助为现在和未来的研究人员创造一个健康的环境,使他们能够在合适的地点发表高质量的论文,我们想为能源预测研究提出以下五个建议。
文献综述
审稿人和编辑希望作者提供高质量的参考文献,以适当地为他们提出的研究奠定基础。
预测的术语
作者应避免在该领域引入行话。大多数问题和过程都可以通过精确地遵循现有的术语来清楚地解释。我们鼓励能源预测者追溯到预测、统计和机器学习文献中原始和正式的术语,如样本外测试[96]和交叉验证[97]。能源预测的一个重要概念是预测范围,它指的是为未来准备预测的时间长度。虽然能源预测的许多子领域使用“短”、“长”及其变体来描述预测范围,但定义往往是模糊的,鼓励作者用精确的语言来描述他们的预测过程。例如,“提前日预报”是指今天某个时候发布的下一个日历日24小时的预报,这与“提前24小时预报”不同。在太阳预报中,研究人员正在远离使用短期、中期和长期来描述预测范围。相反,他们使用小时内、一天内和前一天。
比较研究
要提出一个新想法,你必须将它与现有的想法进行比较,最好是最先进的方法或文献中已经建立的东西:
提高再现性
大多数有经验的编辑和审稿人都明白可重复研究的重要性,作者可以通过使用公共数据或发布他们的数据和代码来提高他们研究的可重复性。有时,研究赞助商可能不允许作者发表数据或代码。在这些情况下,必须使用正式的术语清楚地解释所提议的方法。
找到合适的期刊
并不是所有的手稿最终都能在顶级期刊上发表。为了避免浪费发表时间和评论资源,作者被鼓励寻找合适的期刊来发表他们的研究。例如,在图1中的22个主要的能源预测论文出版渠道中,在II-B部分被点名的论文不太可能被其他期刊拒绝。相反,他们大多在寻找具有高档案价值的研究,突破性的想法,以及对新问题的可靠的技术解决方案。一些期刊,如IEEE Transactions,可能要求一篇论文需要5名或5名以上的审稿人。有些期刊,比如《国际预测杂志》,只需要两个审稿人,但他们的审稿人通常给出全面的评论,可能导致重大修改。如果作者正在寻找一个简单的审查过程,他们可能想要寻找其他场所。一些期刊,如太阳能,强烈支持可重复的研究。愿意发布代码和数据的作者可以考虑这样的场合。
在GEFCom2014完成后不久,竞赛组织者联合起来,对未来10年的能源预测进行了预测,并于2016年发布在[52]上。在本节中,我们通过再次审视历史预测来总结我们的回顾,然后讨论值得在未来十年进行严格调查的两个具有挑战性的问题。
GEFCom2014组织者的预测包括围绕能源预测[52]的12个广泛主题的预测。回顾这些预测,其中有五个已经成为现实:
太阳能发电预测研究确实蓬勃发展。如图1所示,近5年来,关于太阳预报的论文数量迅速增加。这种增长趋势预计还将持续下去。
最近的能源预测文献在时间、空间和概念上越来越多地使用高分辨率数据[87]。
在不同的子领域采用了几种能源预测方法。例如[99]中,24个节气最初被用作负荷预测的输入特征。[100]将这一想法应用于风的预测。再如,copulas首先应用于风电功率预测[101],然后发现copul-as在太阳能功率预测中的有效性[84]。
能源预测主题的多样化早在五年前就预测过了。此后,我们又看到了以往很少研究的波浪能预测[102]、无功[23]、需求响应能力预测[103]等预测研究。
自2014年GEFCom2014以来,举办了许多大大小小的预测比赛。GEFCom2017只是[51]的一个例子。随着比赛的好处被社会所认可,我们期望将来举办更多的比赛。
在负荷预测中,我们尝试研究为了使点预测误差措施最小而选择的变量是否也可以是使分位数分数最小的最佳模型[67]。[104]研究了预测残差如何取决于点预测和相关因素,验证了点预测越好,概率预测越好。在这一方向上需要更多的探索,不仅是在负荷预测方面,还有能源预测的其他子领域。
在2015年进行预测时,净负荷预测是针对能源预测问题的融合提出的一个具体例子。当时,关于电表后太阳能估算和净负荷预测的研究很少。五年后,文献[105]-[108]中出现了一些关于这一主题的扎实研究。负荷与区位边际价格(LMP)是深度耦合的。[109]研究了如何在考虑负载不确定性的情况下获得概率LMP预测。我们预计,未来几年,能源预测的多样化问题将继续增多。
在能源预测的不同子领域之间、在能源预测界和其他科学界之间、以及在工业界和学术界之间的合作,在过去几年中一直在增长,并将在未来增长。
虽然能源预测的定期会议尚未建立,但第一届国际能源分析研讨会(ISEA)已于2017年召开。两年后的2019年,国际预测研讨会首次举办了全面的能源演讲,在三天内涵盖了30多场演讲。
我们还没有一个专门的能源预测出版物。然而,图2中所列的大部分(如果不是全部)主要场所至少已经任命了一名编辑或副编辑来处理能源预测论文。2019年,领先的预测期刊《国际预测杂志》(Inter-national Journal of Forecasting)任命IEEE研究员皮埃尔·品森(Pierre Pinson)为其主编,原因是他在风力发电预测方面的贡献。
在2010年代,IEEE能源预测工作组(WGEF)在推动最先进技术的发展方面发挥了领导作用。2019年,WGEF将其范围从预测扩展到分析,并更名为IEEE能源预测与分析工作组(WGEFA)。同样在2019年,国际预报员协会启动了SWEET(水,能源和环境科)。SWEET为能源及周边地区的预测者提供网络和合作机会。当WGE-FA继续以电力为重点开展活动时,SWEET从更广泛的社区带来了研究人员和实践者。从不同的角度解决能源预测问题,希望两家机构能够相互补充,在未来继续壮大社区,推进研究进展。
在[52]的12个预测中,有一个还没有太大进展:
用于概率能量预测的实际误差测量方法的发展还没有看到很大的进展。事实上,制定正确反映能源预测误差值的措施是一个值得研究的领域。我们在第6- c节对这一项目进行深入讨论。
没有什么预测是完美的。人工智能/ML及其在能源预测方面的应用被[52]的这一历史性预测完全忽略了。在本文中,我们在第3- a部分专门讨论AI/ML。
在实践中,预测是产生的,因此决策者可以采取行动,以优化未来的结果。例如,大的工业负荷可能会减少其消费,以应对预期的高价格。同样,电池存储设施可能会决定充电,以响应预期的低价格,因为在夜间高风力发电或在阳光明媚的白天高太阳能发电。这些操作将改变加载概要文件。如果变化很大,由于决策者对原始预测的反应,本应准确的负荷预测与实际观测到的负荷相比可能变得不准确。负荷分布的变化也会改变潜在的价格形成过程,从而改变价格。在[51]中,预测需求响应引起的负荷变化是未来的研究方向。
在发布原始的负荷和价格预测时,没有考虑到用户或预测接收者所做的预测后行动。因此,预测模型是盲目的。观测到的负荷和价格最终可能会与预期大相径庭。换句话说,典型的预测模型是“开环”的,而预测过程本身就是“闭环”的。可以说,这个问题对电价的影响比对负荷、风能和太阳能的预测更大,因为影响电价的决策因素太多了。在电价预测的背景下,对这一概念的深入讨论可以在[110]中找到。
关于闭环预测的另一个辅助问题是历史数据的变化。例如,在炎热的夏季,为了应对预期的高价格,电力公司可能会启动其需求响应程序,以减少或转移预期的年度高峰负荷。如果在没有适当处理的情况下将转移的负荷剖面用于未来的建模活动,预测模型往往会低估负荷剖面对高温的响应。因此,在没有需求响应程序干预的情况下,模型会低估“有机”或“不受控制的”峰值负荷,或峰值负荷。同样的类比也适用于能量预测的其他子领域。
在经济学中,弹性是对一个变量对另一个变量的响应(成比例)变化的度量。考虑到全球智能电网计划带来的对价格敏感的市场参与者的增长,应该设计新的模型来考虑这种价格弹性。
能源预测界很好理解的典型误差度量可能不一定反映减少预测误差的经济价值。正如[111]中关于负荷预测的论述,从短期机组承诺的角度来看,对于10,000 MW的电厂,预测误差减少1%,每年可节省160万美元。类似规模的节约是在最近的一项研究中得出的[112],该研究考虑了几个因素,如公司的规模、受预测模型影响的区域等。然而,能源预测的准确估值是非常困难的,如果有可能的话。这是因为能源预测被用来影响或指导决策过程。如何使用预测将影响预测误差的估值。根据业务应用程序的不同,成本函数对于正错误和负错误可能是不对称的。
[113]论证了提高电价预测误差的经济价值的衡量是相当复杂的。换句话说,一个产生较低误差的模型可能并不总是为预测用户提供一个更有效的模型。因此,重要的是将评估措施与用户的特征联系起来,并定义更好地捕捉竞争价格预测模型的优势和劣势的替代指标。解决这一问题的尝试包括基于实际价格与其预测结果的比较提出简单的竞价策略[114],[115]或使用金融组合分析中流行的度量方法,如夏普比率[116],[117]。最近的一项研究表明,在动荡的市场时期,对于微电网能源管理,与更复杂的随机和鲁棒模型相比,带有点价格预测的移动地平线确定性模型可以显著降低运营成本[118]。当然,在这方面还需要做更多的研究。正确评估能源预测还可以提高预测者在其组织和能源行业的认可度。
图3显示了2019年6月德国的主要发电来源(常规、风能、太阳能)、全系统负荷和批发电价(前一天、当天)。请注意6月25日(周二)20:00由于相对较高的需求和较低的风力发电,ID价格飙升。还要注意6月8日(周六)和6月30日(周日)的负价,当时大规模的风能和太阳能发电将传统电力的需求降至月度低点[119]。这样一幅图完美地说明了让能源预测者跨子领域合作的必要性。越来越多有影响力的研究将来自跨学科合作。
这篇文章为对能源预测感兴趣的当前和未来的研究者和实践者充当能源预测的初级读本。审查并不意味着穷尽一切或全面全面。我们主要关注近20年来发表的有影响力的论文,以及20世纪后期的经典评论文章和原创研究论文。感兴趣的读者可能会发现参考文献列表是一个高质量的来源的论文阅读。我们相信,可再生研究是社区作为一个整体需要追求的,而跨学科合作可以导致突破性的研究成果。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。