面向电力和数据工程师的开源数据科学工具包

导读截至2020年,美国已安装了1.029亿个智能电表——用于记录电力消耗、电压和电流并将其传达给消费者和电网运营商的设备。随着智能电表的数量...

截至2020年,美国已安装了1.029亿个智能电表——用于记录电力消耗、电压和电流并将其传达给消费者和电网运营商的设备。

随着智能电表的数量和对能源的需求预计到2050年将增加50%,这些智能电表产生的数据量也将增加。

虽然能源标准已经实现了大规模的数据收集和存储,但最大化这些数据以降低成本和消费者需求一直是能源研究的重点。

为了帮助充分利用所有这些数据,劳伦斯利弗莫尔国家实验室(LLNL)团队开发了GridDS,这是一个面向电力和数据工程师的开源数据科学工具包,它将提供集成的能源数据存储和增强基础设施,作为以及一套灵活而全面的最先进的机器学习模型。

实验室应用科学中心的首席研究员兼数据科学家IndraChakraborty说:“到目前为止,还没有开源平台提供数据集成或机器学习模型。现有的少数平台是专有的,无法提供给更广泛的研究社区使用。”计算(CASC)。“作为一个开源工具包,GridDS为世界各地致力于应对这些挑战并希望充分利用这些数据的数据和电力科学家打开了大门。”

通过提供一个集成的软件平台来训练和验证机器学习模型,GridDS将有助于提高分布式能源的效率,例如智能电表、电池和太阳能光伏装置。

GridDS还旨在利用先进的计量基础设施、停电管理系统数据、监控数据采集和地理信息系统来预测能源需求并检测初期电网故障。

GridDS为这些多数据流提供了一个模块化、可通用的Python软件库。在适应各种设备记录的不同数据集时,GridDS提供了一系列独特的功能,这些功能目前尚未在当前的高级分发管理系统中实现,这些系统往往在设计上具有高度特定的软件基础设施。

“以前的实验表明,当针对给定的能源问题应用最佳机器学习模型时,一只鞋并不适合所有人。每种情况都是不同的,背景是关键,”能源基础设施副项目负责人VaibhavDonde说现代化。

“我们发现研究人员最好尝试几种方法来看看哪种方法最有效。使用GridDS,您可以对任务设计进行小幅调整,例如自回归中的视野或历史,或在数据集之间传递机器学习模型,这使得学习迁移和更广泛的模型验证。GridDS可以采用通用方法,将它们应用于高度具体的能源任务,并评估和验证它们的性能,”Donde补充道。

GridDS还可以快速有效地测试能量和传感器时间序列问题的几种方法并训练模型超参数。

免责声明:本文由用户上传,如有侵权请联系删除!