【学术】智能配电网大数据应用需求和场景分析研究

2015-04-22 09:17:53 中国电机工程学报   点击量: 评论 (0)
中国电力科学研究院的研究人员刘科研、盛万兴等,在2015年第2期《中国电机工程学报》上撰文,智能配电网中存在大量异构多源的数据,其中的数据规模和特点符合大数据的各项特征。首先总结配电网大数据的来源和特征


5 配电网大数据分析方法和手段
 
5.1 配电网数据特征聚类
 
聚类可用于将数据分割成多个类或子集,在聚类分析中类的数量是未知的。常见的聚类方法有划分聚类法、层次聚类法、网格聚类法、基于模型的聚类法以及智能聚类法等。根据不同聚类方法的适用范围及配电网大数据的特征,通过研究基于配电网时空特性的数据聚类方法,能够提出处理配电网时空特性的数据聚类解决方案。
 
从配电网调度系统和负荷监测中提取不同区域、不同类型的用户负荷曲线,进行负荷特性聚类分析,为电力公司营销和负荷管理提供依据,是近几年电力系统聚类分析的研究热点[8-9]。通过对负荷曲线的聚类,可以作为负荷预测和电价预测的预处理过程;通过分析配电网线路和设备故障信息,形成具有相似变化的曲线簇,可更好地估计和抑制故障带来的影响。
 
5.2 配电网数据特征分类
 
分类是通过训练产生的分类函数或分类模型将数据对象映射到2 个或多个给定类别的方法[10-12]。从机器学习的观点,分类分析是一种有指导的学习,即其训练样本的分类属性(类标号)的值是已知的,通过学习过程形成数据对象与类标示间对应的知识,这类知识也可称为分类规则。
 
分类通过已训练好的模型或分类规则来预测、标记未知的数据类。分类方法包括决策树归纳法、K最近邻法、向量空间模型法、贝叶斯分类法、支持向量机模糊分类及神经网络法等。在配电网配电变压器故障识别和诊断中,可以通过贝叶斯分类方法将变压器故障分类为内部或外部的接地和短路故障;也可以用神经网络来识别包括高温、低能和高能状态等故障类型。
 
5.3 配电网大数据快速分析技术路线
 
数据挖掘技术的选择由相应需要解决的业务问题来决定。要解决一个业务问题,在一个数据挖掘的完整流程中,需要同时利用多种数据挖掘方法。例如在数据预处理阶段,可以通过统计性描述方法对数据的本质、质量进行探索和分析,利用无量纲化的模型对数据进行标准化处理,也可以用聚类分析对临群点进行探索等。
 
基于配电网大数据聚类与分类技术,研究面向大规模配电网大数据的快速数据分析与处理技术,其技术路线如图4所示。
 
图4 配电网时空特性的快速数据处理方法
 
【学术】智能配电网大数据应用需求和场景分析研究
5.4 数据密集型计算手段
 
目前分布式并行计算技术是数据密集型计算的主要手段。由于大数据的数据量和分布式的特点,使得传统的数据管理技术难以胜任这种海量数据。很多企业开始想方设法把大数据存储起来,不断地尝试新的大数据存储架构、研究大数据分析方法技术。

大云网官方微信售电那点事儿

责任编辑:叶雨田

免责声明:本文仅代表作者个人观点,与本站无关。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
我要收藏
个赞