构建大规模真实电力传输网络数据集的管道:从公开数据出发

TL;DR · AI 摘要
微软研究团队利用公开数据构建了覆盖美国48个州的电力传输网络模型,支持AC-OPF分析。
核心要点
- 构建了覆盖48个州的电力传输网络模型
- 支持AC-OPF分析,用于物理层面的电网研究
- 模型包含11到21,697个节点,适用于不同规模研究
结构提纲
按章节快速跳转。
思维导图
用一张图看清主题之间的关系。
查看大纲文本(无障碍 / 无 JS 友好)
- 电力传输网络模型构建
- 背景与挑战
- 真实电网数据受限
- 影响研究和决策效率
- 解决方案
- 基于公开数据构建模型
- 支持AC-OPF分析
- 模型特点
- 地理和电气一致性
- 透明不确定性报告
- 应用场景
- 输电扩展潜力分析
- 线路升级规划
- 数据中心负载部署
- 数据集范围
- 覆盖48个州
- 节点数从11到21,697
金句 / Highlights
值得收藏与分享的关键句。
我们利用公开数据构建了覆盖美国48个州的电力传输网络模型,支持AC-OPF分析。
这些模型可以用于研究电网容量限制、新需求吸收位置以及基础设施变化的影响。
模型覆盖范围从11个节点到21,697个节点,适用于不同规模的研究。
标题:从公开数据构建大规模现实电力传输电网数据集:一个管道
URL 源:https://www.microsoft.com/en-us/research/blog/building-realistic-electric-transmission-grid-dataset-at-scale-a-pipeline-from-open-dataset/
发布日期:2026-05-08T19:53:56+00:00
Markdown 内容:

一目了然
- 我们完全从公开可用的数据构建具有地理基础的、电气一致的电网模型,并发布了一个涵盖美国48个州和多州互联的数据集。
- 这些模型支持交流最优潮流(AC-OPF)分析,使研究人员能够在不使用受限数据的情况下进行拥堵、容量和需求选址的基于物理的研究。
- 我们展示了包括输电扩展潜力、有针对性的线路升级以及大型数据中心负载放置等应用。
微软研究院很高兴发布一个基于公开数据的美国电网近似传输拓扑的开放数据集。
研究输电级别的电网行为对于现代电力系统研究至关重要。对拥堵、输电扩展、需求增长和系统弹性的分析都依赖于具有真实拓扑结构、电气参数和地理基础的网络模型。
在世界大部分地区,包括美国,真实的输电级别电网数据被归类为关键基础设施信息,并受到严格的访问控制。这些限制有其合理的原因,但由此产生的缺乏真实电网模型正日益加剧电力系统面临的挑战。关于新负载可以添加的位置以及如何部署额外的输电资产来支持它等决策,通常需要经过漫长而不透明的过程,可能需要数年时间。对于开发新工具和算法的研究人员来说,访问通常需要漫长的审批周期、严格的非再分发协议或昂贵的商业许可证。
亮点:AI驱动的体验

微软研究院 Copilot 体验
通过我们的 AI 驱动体验了解更多关于微软的研究
因此,许多人不得不在只有几十个节点的小型“玩具”网络或与真实基础设施无关的合成模型之间做出选择。这种缺乏真实且可共享模型的情况对数据驱动和基于人工智能的方法尤其有限,因为这些方法需要大量物理上合理的电网数据来进行训练和评估电网分析和规划方法。
在这种背景下,一个自然的问题出现了:
我们能否仅使用公开数据有意义地了解美国电网对现代压力的反应,并促进系统的可行解决方案的开发?
在这项工作中,我们介绍了一种从公开数据中派生的管道,用于构建大规模、输电级别的电网模型,这些模型可以真实地近似现有网络,而不依赖专有或受限的数据集。我们提供了一个从该过程派生的开放数据集,其中包括覆盖美国48个州以及互联规模网络的输电级模型,其规模从小型系统(最少有11个节点)到连接21,697个节点的完整东部互联电网。该管道已在整个美国大陆得到验证,在那里有足够的公开地理、能源和人口统计数据可用,并设计为可以推广到其他拥有类似公共数据源的地区。
仅使用公开可访问的数据集,该管道可以在州、多州和互联尺度上生成具有地理基础且可用于潮流分析的输电模型。这些模型保留了从公开数据推断出的输电走廊、变电站和发电机的地理结构,同时在详细操作参数不可用时通过透明的可行性报告明确考虑不确定性。
重要的是,这些不是玩具网络或抽象基准。这些模型支持在广泛尺度上的交流最优潮流(AC-OPF)分析,使研究人员能够基于物理研究诸如输电容量在哪里受到物理限制;哪里可以吸收新的需求;以及基础设施变化如何通过真实的网络布局传播等问题——仅使用公开数据。
在本文中,我们将以高层次描述该方法,并突出它所启用的系统级问题。
管道的工作方式
该管道将公开可用的地理和能源数据转化为具有地理基础并可用于潮流分析的输电级电网模型。
起点是 OpenStreetMap (在新标签中打开),它编码了输电走廊、变电站和发电厂的物理布局。这个地理骨架随后通过描述发电能力、燃料组合、需求和操作边界(包括美国能源信息署(EIA)的能源统计数据和美国人口普查数据)的公开数据集进行增强,使模型超越拓扑结构,表示电力是如何生产和消费的。
关键测试是可解性。在电力系统分析中,求解最优潮流(OPF)问题是检验网络描述是否具有电气一致性和实际相关性的实用方法。OPF确定了如何调度发电以满足需求,同时遵守传输线路容量、电压限制和发电机能力等物理约束。许多推断或合成的网络会直接通过这个测试:拓扑结构可能看起来大致正确,但其他重要的工程参数却不符合。
至关重要的是,这种方法超越了小型基准或“玩具”网络。具体来说,我们在整个东部互联系统中求解交流 OPF,覆盖 36 个州和超过 20,000 个母线,这些数据完全来源于公开的数据源。这表明,基于开放数据的模型可以在大陆尺度上产生收敛的 AC-OPF 解决方案。
需要明确的是,这些模型并不是运营电网的精确副本,也不打算用于电力平衡机构的市场预测或实时操作决策。电气参数是从标准工程参考中估算的,平行电路是近似处理而非详尽枚举,而需求则是使用从开放数据派生的公开代理进行分配的。
目标是利用仅有的开放数据,生成在结构和电气上都现实的模型,保留从单个州到大型多区域系统的地理结构和规模。完整的方法论细节、验证结果和局限性在一篇配套研究论文中进行了描述。
这对当今能源挑战的意义
获得可解的、具有地理基础的电网模型,可以解答随着能源系统演进而变得日益紧迫的问题,这些变化由大规模数据中心、AI 工作负载、可再生能源和极端天气事件驱动。我们通过从我们的流程中得出的模型进行具体的分析来说明这些能力。
新的输电线路在哪里可以物理安装?
在询问电网需要多少新容量之前,规划者首先必须问哪里可以增加更多的线路。输电走廊对能承载的电路数量有物理限制:每条电路需要三条导线,大多数塔结构容纳一到三条电路(三到九条导线)。超过这个数量,增加容量通常需要获取全新的通道——这成本高昂、法律复杂,并且在城市地区往往政治上不可行。
由于我们的模型保留了来自 OpenStreetMap 的真实输电走廊的地理结构,我们可以沿每条路径计算并行电路的数量,并可视化电网在哪些地方已经物理饱和。


图 1. 在美国本土(顶部),该模型识别出 31,488 条不同的输电走廊。绝大多数(27,506 条)只携带一条电路(绿色),使得并行线路更容易。大约 4,000 条橙色至红色的走廊已经携带两条或更多并行电路,最密集的路径上甚至有十条电路(30 根导线)。放大查看加利福尼亚(底部),模式更加清晰。萨克拉门托以北的红色走廊以及旧金山湾区和洛杉矶盆地周围的橙色群集显示了电网已经物理密集的地方,而穿过莫哈韦和进入内华达州的长绿辐射线路仍有增长空间。
无论发电或需求如何,识别电网在物理上被限制的位置都不是一个优化问题。这是一个空间可行性问题,具有地理基础的模型能够独特地回答这个问题。
如果我们在最需要的地方增加容量呢?
在密集的城市地区,增加新的传统输电线路通常是不切实际的。紧密排列的建筑物、道路和复杂的地下基础设施几乎没有空间建立高压线路的通道。有时会探索替代的电力传输解决方案来支持城市电网扩展。例如,高温超导(HTS)电缆系统为给定截面积提供了数量级更高的载流量,使在较低电压下传输大量电力成为可能,并简化了许可要求。
短距离点对点超导电力链接已经在一些美国城市中得到演示:俄亥俄州哥伦布市、纽约州阿尔巴尼市、纽约长岛(已退役)和芝加哥(运行中)。
为了探讨这样的连接可能实现的效果,我们在马萨诸塞州电网中模拟了两条假设的 HTS 链接,每条连接波士顿西北部的一个变电站与靠近城市的负荷中心。然后重新求解 AC-OPF 并将结果与未修改的基线进行比较。


_图2. 在基准情况下(顶部),一条输电线路超过了其热容量(≥100%,深红色),另外两条线路的负载超过90%。在添加两条HTS链接后(底部,虚线),网络中的每条线路的负载都低于90%。由于原本受制于受限走廊的发电现在可以交付,能源价格下降了42%,从22.7美元/MWh降至13.1美元/MWh。_
这正是公开可用的价格数据无法提供的洞察。批发电力价格反映了是否存在拥堵,但无法反映系统距离拥堵有多近,也无法反映当新增资产时功率流动如何变化。一条线路运行在其热极限的95%和另一条线路运行在50%在市场数据中看起来是一样的——直到其中一条线路达到容量。基于物理的模型直接揭示了这一余量,使得可以在建设之前评估干预措施。
新需求应放在哪里?
电力需求的快速增长提出了一个现有市场信号回答不佳的问题:在网络的哪个位置可以吸收新的用电而不触发拥堵?
批发电力价格反映了边际发电成本、当前输电电网的拥堵模式以及输电损耗,这些通常很小——但它们并未捕捉到系统距离其极限有多近。因此,仅基于价格做出的选址决策会忽略决定新需求是否能被满足而无需基础设施升级的物理余量。
为了说明这一点,我们在马里兰州电网的两个位置放置了相同的假设性500 MW数据中心,并为每个位置重新求解了AC-OPF(位置是任意选择的,不代表微软的数据中心组合或扩展计划)。这两个地点从市场角度来看是合理的替代方案,具有相似的人口密度、相近的电价以及靠近主要负荷中心:
- 地点A(巴尔的摩地区):位于巴尔的摩都会区的一个变电站,靠近现有的发电设施和密集的输电基础设施
- 地点B(华盛顿特区郊区):位于蒙哥马利县的一个变电站,服务于华盛顿-巴尔的摩走廊内同样密集的郊区区域
尽管有这些相似之处,物理结果却有所不同。在地点A放置数据中心会使附近的输电线路进入热过载状态,而在地点B放置相同负载则会被现有网络吸收,不会违反线路限制。这两个地点相距不到50英里,但一个需要输电增强,另一个则不需要。


_图3. 将数据中心靠近巴尔的摩(顶部)放置会将一条输电线路推入过载(≥100%),并将能源价格从基准值24.6美元/MWh提高到28.6美元/MWh(+16.1%)。相同负载靠近华盛顿特区郊区(底部)则保持所有线路低于95%,并将价格提高到26.4美元/MWh(+7.4%)。巴尔的摩地点的价格高出2.1美元/MWh——这一差异,对于500 MW的负载来说,相当于每小时约9,100美元或每年约8000万美元。_
这种区别——在价格数据中几乎不可见——直接来自于更直接的第一原理输电级功率流分析。它突显了为什么在压力较大的电网中,地理上扎根的基于物理的模型对于需求选址决策是必要的。
展望未来
这项工作表明,即使没有访问受限的基础设施数据,也可以在现实规模下研究输电级电网行为。通过将模型建立在真实地理基础上并明确不确定性,基于开放数据的电网可以支持难以或不可能通过小型基准或纯合成网络进行的分析。
虽然这里的例子集中在美国内部,但该方法可以推广到其他地区,只要这些地区有类似的开放数据。更广泛地说,我们认为这种能力是一种使能层:一种改进拥堵、可行性及系统压力研究的方法——无论是用于规划研究、情景分析,还是需要现实电网结构的数据驱动方法。
我们正在发布一个涵盖美国48个州和六个多州互联的电网模型的开放数据集,范围从小型系统(几十个节点)到大陆规模的网络。所有模型都可以在AC-OPF下求解,必要时应用受控松弛以考虑开放数据输入中的不确定性。这些模型针对高峰和非高峰需求条件进行了求解,从而能够在各种运行场景中进行一致的分析。
这篇帖子是两部分系列的第一篇。在第二篇帖子中,我们将介绍GridSFM,这是一种基于学习的AC-OPF代理,训练数据来自这些电网模型。我们展示了它如何在毫秒内预测完整的AC运行点,对大规模规划进行快速筛选分类,并作为加速下游数值求解器的热启动种子。