职场文秘网

首页 > 心得体会 > 学习材料 / 正文

基于卷积神经网络的居民用电异常检测方法

2023-02-06 11:20:10

陶 华,庄友谊*,戴 欢

(1.温州大学 电气与电子工程学院,浙江 温州 325035;
2.温州大学 计算机与人工智能学院,浙江 温州 325035)

随着经济和社会的快速发展,人民生活水平不断提高,各类用电设备越来越多。但是由于不当的控制策略和不合理的用电行为,不仅会导致大量能源浪费,甚至会引起严重故障或事故。近年来,随着电力大数据技术的普及与应用,除了能获得用户的最终用电费用外,还能收集大量细时间粒度的用户用电过程数据。如何从这些海量数据中挖掘出用电异常信息,从而为用户及时发现设备异常、减少能耗损失提供决策依据,对于实现节能减排目标具有重要意义。

由于传统的人工检测方法存在成本高[1]、效率低、实时性差[2]等不足,利用机器学习技术进行用电异常检测已成为国内外研究热点。文献[3]改进K-means 算法,应用于电力数据,实现了电力数据聚类并有效检测出异常的净电能输出曲线。文献[4]提出了一种基于模糊聚类和孤立森林的异常检测方法,该算法更适用于异常点较少的实际用电数据。文献[5]将可能性模糊C 均值(PFCM)算法和改进的粒子群优化(PSO)算法相结合,优化了PFCM 算法的初始中心和数目,有效地降低了误检率。文献[6]使用改进的自编码关联规则挖掘算法(ACT-Apriori)进行电网故障诊断。文献[7]利用随机森林和箱线图相结合,应用于建筑功耗异常值检测领域。文献[8]采用长短时记忆神经网络(LSTM)进行功耗预测和异常检测,关注长期电力消耗的异常检测,大大提高了召回率。文献[9]提出基于回归分析的建筑能耗异常识别算法,实现了多属性能耗异常数据的可靠识别。文献[10]提出了一种基于D-S 证据理论的不平衡数据多划分(MP)聚类算法,对建筑能耗中的异常值进行检测,能够有效避免样本“均匀效应”。

但是,定义居民用电设备的能耗异常,并且利用居民用电数据提取相应的分类规则,最后进行异常分类和检测的研究还较少。异常分类可以及时找到异常产生的原因,并且及时反馈给用户对设备问题进行维护,以及改善用户非必要的能源浪费行为。在此基础上,本文提出了基于卷积神经网络(convolutional neural network,CNN)的居民用电异常检测方法。

近年来,深度学习蓬勃发展,卷积神经网络在语音识别[11]、图像处理[12]、自然语言处理[13]以及电力系统

[14]等众多领域取得重要进展。CNN 网络结构一般由输入层、隐含层和输出层组成,其中隐藏层包含卷积层、池化层和全连接层,见图1。

卷积神经网络(CNN)的输入层为一组二维数据矩阵图。卷积层对卷积核和输入样本矩阵的局部区域进行卷积运算,经过非线性激活函数后得到多个特征面。卷积计算公式为

式中,l 为网络层数;
y为第l 层的第i 个特征映射;
x为l-1 层的特征面;
Ki、b 分别为卷积核的权值和偏置;
激活函数 δ=max(0,x)。

卷积层之后的池化层是对卷积层的输出进行筛选过滤,通过滑动窗口对局部接受域进行下采样,在保留原特征的同时减少神经网络训练的参数,降低过拟合风险以及减少训练时间。常见的池化方法有最大池化即取局部接受域中最大的值和均值池化即取局部接受域的均值[13]。最大池化的操作见图2。

全连接层置于CNN 的最后几层,其中每个神经元都与前一层所有神经元相连,因此被称为全连接。最终的输出层使用SoftMax 函数进行分类,返回属于某一类别的概率。SoftMax 函数将分类器的输出值转换为范围在[0,1]且和为1 的概率分布。转换公式为

式中,Si表示分类器对输入数据在第i 个类别上的输出值,C 为类别的个数。

2.1 分类规则

研究表明,在家庭中大约可以节约10%到40%的电力[15],但是,大量居民轻视非必要的能源消耗问题,经常在没有他们实际存在房屋的情况下保持电器长时间打开,极大地影响了能源利用率[16],尤其是对于电视机、空调、电灯、笔记本电脑、台式机和风扇等开关设备而言。此外,当用电器功率过大,出现过载现象,影响正常用电,甚至是损坏设备或引发事故。因此,定义设备空置消耗和设备过载为居民用电过程中的两大异常能源消耗。因用电设备具有打开和关闭的操作模式,将正常能源消耗定义为使用良好、打开设备和关闭设备。所以,本研究开发检测并分类为5 个类别:“使用良好”、“打开设备”、“关闭设备”、“设备过载”、“设备空置”,见表1。

表1 用电类型

用电器在正常使用功耗范围内视为使用良好。而决定用电器打开或关闭的两大因素是设备的最大待机功耗(maximum standby power consumption, max(S))和最小使用功耗(minimum active power consumption,min(A))。当设备从待机状态切换至使用状态,则此刻说明设备打开;
反之,则为关闭电器。

判断用电器是否过载的条件主要依据设备最大使用功耗。当设备功耗大于或等于95%的最大使用功耗(maximum active power consumption, max(A)),则说明该电器过载。此外,特别引入了房间占用情况(occupancy, O),为房间是否存在用户设置标志,即用户在房间内/外(1/0)。该特征的引入目的是检测设备空置异常,若当用户不在房间内,设备仍处在运行状态,此时设备空置,造成能源浪费。

算法1 总结了上述能源消耗分类规则,其中输入为每个设备的占用情况(O)、功耗(P)、最大运行时间(max(T))、待机功耗(S)、使用功耗(A)。

2.2 基于卷积神经网络的居民用电异常检测

基于卷积神经网络的居民用电异常检测流程见图3。

为了检测和识别用电设备的能耗异常,利用能源消耗分类规则对数据进行注释后,获得相应的能耗标签。在此基础上,采用CNN 分类模型对带标签的能耗数据集进行训练学习,然后,利用真实设备能耗数据进行能耗异常分类和检测。

在本节中,主要介绍了卷积神经网络的模型结构以及分类过程。CNN 模型结构参考AlexNet 模型[17],由两层卷积层和两层最大池化层组成,并且在每个卷积层加入ReLU 激活函数。为了防止梯度消失或梯度爆炸,并加入Dropout 层消弱过拟合。最后输入到全连接层,然后再将中间值输入到输出层,输出层使用的是Softmax 函数,见图4。

CNN 分类器训练过程中,每次模型的输出与能耗数据标签进行对比,通过反向传播调整权重参数,最终获得并保存最优模型。

CNN 将经过不平衡数据处理过后的数据集作为输入,使用多个卷积核进行卷积运算,获得卷积层特征图。最大池化层则通过3×3 滤波器和步长为2 的滑动窗口进行降维下采样,提取数据权重大的特征,最后展平输出至两个全连接层。第一层全连接层实现特征降维,数量为32,激活函数为ReLU;
第二层全连接层激活函数设置为SoftMax,其神经元数量取决于能源消耗类别的数量,即数量为5,输出最后的分类结果和准确率。SoftMax 函数能够对定义的5 种能源消费类型进行判断,并且采用one-hot 编码为5 种能耗类别进行编码。[1,0,0,0,0],[0,1,0,0,0],[0,0,1,0,0]分别对应着三种正常能耗类型,而[0,0,0,1,0],[0,0,0,0,1]则对应设备能耗异常状态。最终输出该数据在5 个类别中的评分,评分越高代表该数据是这个类别的可能性越大。

因此通过分类规则,为能耗数据集进行类别标定,再利用CNN 对设备能耗数据进行分类和异常识别,是一种简单高效的异常检测方法。

本研究采用的数据源为荷兰住宅能源数据集(Dutch Residential Energy Dataset,DRED),该数据集在荷兰某房屋采用智能电表和传感器收集了12 种用电器功耗,采样频率为1 Hz;
房间占用情况通过每隔1 分钟扫描WiFi 接入点、蓝牙信号以及相关机器学习算法确定居住者的位置。最后,根据对用电器使用模式的相似性,实验选取笔记本、电视两种设备。

3.1 数据预处理

由于使用传感器收集和记录数据的过程中,数据缺失和数据异常的情况常有发生。为了降低数据缺失和异常对模型训练造成误差,本文采用邻近值求平均值进行补充或替换。此外,能源消耗分类规则对数据进行标注后,能耗标签数量见表2,正常和异常数据产生了数据不平衡的问题,打开设备与关闭设备占比较低,容易造成误分类,因此,本文引入功耗归一化(power consumption normalization,PN(t)) 和功耗量化(power consumption quantification,PQ(t)),用于提高分类器对打开设备和关闭设备这两个类别的检测效率,缓解数据不平衡的问题。

表2 标签数量

3.2 评价模型设置

3.2.1 对比设置

本文的对比实验选取在能耗异常检测领域应用较为广泛的4 个机器学习模型:线性判别分析(LDA)、K近邻算法(KNN)、随机森林(RF)以及支持向量机(SVM)。

3.2.2 模型评估

本文采用准确率、F1 分数评价模型的分类准确度,计算公式为

3.3 用电异常检测结果分析

图5 和图6 展示了两个不同设备的部分分类效果以及对应的功耗概况。黑色实线表示用户正在室内使用设备。而灰色虚线代表此刻用户外出,且如果其高度大于0,则说明电器设备处在运行状态,造成不必要的能源浪费。此外,顶部灰色数字显示CNN 分类器分类正确的能耗标签,反之若为黑色,则分类错误。如图5 所示的黑色数字,分类器将其检测为类别0(使用良好),而其能耗约为64 W,超过了电视的最大使用能耗,且此刻用户处在室内,那么,其对应能耗标签应为类别3(过度使用)。

本文部署了一个10 倍交叉验证法,避免分类器过度拟合。操作是将输入数据及其标签分成10 个子组,然后对9 个子组进行监督训练,并使用剩余子组评估模型的精度和F1 分数性能,最终结果取平均值。分类性能结果见表3。

从表3 可以明显看出,LDA 的分类性能最差,高斯核的支持向量机优于LDA,这是因为LDA 难以处理非线性数据,并验证了特征与相应类别之间的复杂性。SVM、KNN 以及RF 都表现出了高准确率和低F1分数。原因在于,当数据存在数量级极小的异常类,模型总是将数据分类为正常类,导致准确率高,但该模型实质上无法检测并分类出异常,因此准确率被视为不稳健指标。

表3 不同机器学习算法的性能比较

那么,引入F1 分数对分类器性能进行综合评估。F1 分数是召回率和精确度的调和平均值,是更加可靠的评价指标。从表3 看出,CNN 优于其他分类器,在电视数据集下获得99.80%的准确率和99.85%的F1 分数;
在笔记本数据集中准确率为99.94%,F1 分数为99.58%。所以,CNN 分类效果最好。

CNN 分类器的混淆矩阵见图7 和图8,每个单元格显示标签分类的数量以及分类的百分比。对角线单元格显示每个类别正确分类的百分比,对角线之外的单元格均为错误分类。混淆矩阵显示分类错误的类型。对于电视数据集,CNN 将11 个类别3(过度使用)错误分类成类别0(良好使用)。类别3 的分类准确率为99.68%,类别4 的分类准确率为100%,平均分类准确率为99.77%,见图7。对于笔记本数据集,CNN 会将类别4 错误分类成类别0、类别1、类别2。过度使用(类别3)的分类准确率为100%,外出消耗(类别4)的分类准确率为99.93%,平均分类准确率为99.59%,见图8。

3.4 用电异常可视化

可视化工具让用户获悉用电异常并减少非必要能源消耗。本节以笔记本电脑数据为例。图9 为能耗时序图,以瓦特(W)为单位,展现了笔记本电脑的能量消耗随时间的变化。图10 和图11 描绘了5 种能源消耗的散点图,采样间隔分别为1 秒钟和1 分钟。从图10 和图11 可以看出,笔记本电脑长期处于待机状态或运行状态,而用户外出,造成设备空置异常(类别4),形成不必要的能源消耗。因此,可视化工具能够便捷地定位到异常消费,并反馈给用户,尤其是对于分别代表“设备过载”和“设备空置”(类别3 和类别4)。

本研究提出了一种基于卷积神经网络的居民用电异常检测方法,将能耗异常定义为设备过载和设备空置,从设备功耗信息、设备使用特性以及房间占用信息等数据提取能耗分类规则,并采用CNN 模型对其进行分类检测,最后利用可视化工具反馈设备能耗异常,帮助住户改善其能源消耗行为,减少非必要的能源消费。实验结果证明,本文实现的方法在家用电器数据集上进行评估,证明了在能耗异常分类的有效性和高效性,在电视、笔记本数据集下的准确率分别达到了99.80%和99.86%。通过与四种机器学习算法的对比,也证明了本文的算法具有高分类精度。

猜你喜欢 功耗类别能耗 基于任务映射的暗硅芯片功耗预算方法北京航空航天大学学报(2022年7期)2022-08-06120t转炉降低工序能耗生产实践昆钢科技(2022年2期)2022-07-08能耗双控下,涨价潮再度来袭!当代水产(2021年10期)2022-01-12论陶瓷刻划花艺术类别与特征陶瓷学报(2021年4期)2021-10-14探讨如何设计零能耗住宅建材发展导向(2021年23期)2021-03-08一起去图书馆吧少儿画王(3-6岁)(2020年4期)2020-09-13日本先进的“零能耗住宅”华人时刊(2018年15期)2018-11-10揭开GPU功耗的面纱个人电脑(2016年12期)2017-02-13选相纸 打照片微型计算机(2009年4期)2009-12-23环保之功,从主板做起微型计算机(2009年12期)2009-12-21

Tags: 卷积   神经网络   用电  

搜索
网站分类
标签列表