职场文秘网

首页 > 心得体会 > 学习材料 / 正文

基于文献计量的电力大数据研究热点分析

2023-05-08 12:30:06

林正根,孙 禔,安风霞,傅静雯,俞 颖

(1.国家能源集团科学技术研究院有限公司,江苏 南京 210023;
2.国网湖北省电力有限公司电力科学研究院,湖北 武汉 430077)

电力大数据是国家大数据战略重要组成部分,是能源领域和宏观经济的“晴雨表”,是大数据理念、技术、方法在电力行业的实践产出,贯穿能源生产、用能的各方面和全过程。2015 年9 月国务院发布的《促进大数据发展行动纲要》指出,大数据作为数据的一种集合,是发现新知识、创造新价值、提升新能力的新一代信息技术和服务业态。《电力发展“十三五”规划(2016-2020 年)》中,国家也明确要求用好以大数据为代表的新技术。电力大数据支持数字经济发展、服务国家发展战略,是打造当前电力企业新增长点、建设能源互联网、助力工业互联网发展的关键元素。

电力大数据具有如下特点:数据体量大、覆盖范围广,社会经济持续发展催生的如发电数据、电网运行数据、用户用电数据等海量数据,来源丰富、成分复杂;
数据类型多、价值密度低,贯穿电力系统“发输变配用调”各个环节,结构和规模不断变化,非结构化数据占比增大;
时效性强、价值高,电力行业自动化、信息化水平逐步提高,数据采集、传输、应用相关设施逐渐智能化。低时延、高频、高复杂度电力数据经过抽取、转换、清洗、挖掘,最终转化为适配需求的服务。基于电力大数据特点和服务价值的相关研究意义重大。众多学者从不同的角度对电力大数据进行了研究,如薛禹圣等[1]强调将大数据思维作为生产要素,指出大数据思维与大能源思维融合方向;
彭小圣[2]等搭建了具备通用性能的电力大数据平台总体架构,并从集成管理技术、数据分析技术、数据处理技术、数据展现技术4个方面进行了深入探讨;
曲朝阳等[3]介绍了基于云计算技术的电力大数据预处理属性约简方法。

电力大数据的研究在不同文献中各有侧重,但目前结合文献计量分析和挖掘的相关研究仍然相对较少,因此本文采用文献计量的方式,统计电力大数据相关文献近11年的整体发表情况并加以分析,以理清电力大数据的研究侧重和研究热点,并梳理其采集应用特点、研究重点、应用领域、目前存在的问题与对策,具有一定的参考意义。

1.1 文献数据采集

基于数据库引文信息对我国电力大数据研究热点进行分析。文献选择如下:以数据库检索式文摘=“电力”(精确)+“大数据”(精确),时间跨为2010 年-2021年,文章来源类别为北大中文核心。共检索得到文献题录499 条,去除宣传、贺信、新书推荐等不包含作者的文献题录,可得文献题录492条。

1.2 数据分析方法

数据处理:结合数据库的分析报告功能统计文献年发表量,所有筛选文献条以refworks 格式导出为纯文本格式,导入软件分析。采用CiteSpace,v.6.1.R2软件[4]对前述492条文献题录进行数据挖掘与分析。绘制发文作者合作网络图谱时,网络节点为作者,其余采用默认选项;
关键词聚类图谱绘制选择关键词作为网络节点,其余采用默认选项或单独设置。

2.1 论文发表趋势

由图1 可以看出,我国电力大数据领域的期刊文献呈现先平缓后上升,之后表现平稳共3 个阶段。

图1 电力大数据2010年-2021年发文量情况Fig.1 Statics of published papers of large power data from 2001 to 2021

第一阶段(2010 年-2012 年),这一阶段国内关于电力大数据的研究较少,尚处于起步阶段。最早的一篇文献是河南电力调度中心的付红军等人于2010 年发表在《电力设备自动化》期刊上的《电网运行方式综合管理系统设计与应用》,文中总结了电网运行方式综合管理系统的特点,设计了该系统的工作流程和系统架构,对电网的大量数据进行了系统化处理,代表电力大数据的相关研究已经处于开展状态。

第二阶段(2013 年-2017 年),这一阶段关于电力大数据的期刊文献快速增长。从2013 年的6 篇,快速增长到2017 年74 篇。以中国电机工程学会信息化专委会2013 年3 月发布的《中国电力大数据发展白皮书(2013 年)》为标志,电力领域大数据的相关研究呈爆发性增长态势。该阶段文献研究以“数据采集”、“数据流”、“数据质量”“数据中心”、“数据管理”、“数据挖掘”、“应用场景”、“预测”、“模型””、“算法”、“云计算”、“能源互联网”等为主题词或关键词。

第三阶段(2018 年-2021 年),这一阶段关于电力大数据的期刊文献发表基本呈平稳状态,年均发文72篇。此阶段主要围绕“图计算”、“机器学习”、“深度学习”、“模型融合”、“智能电网”、“数据云平台”、“能源大数据”、“一体化计算”、“广域分布代理”、“集合覆盖模型”、“结构化数据”、“混合计算”、“区块链”、“精准预测”、“可视化”等主题词或关键词进行研究。这一阶段的研究具有两个特征:一是大数据在电力领域的研究广度扩大、深度加强;
二是在电力细分领域的研究具有更强专业性和针对性。

总体来看,从2010年-2021年,电力产业发展伴随着科学技术的不断进步而表现出明显的技术特征,学术研究经历了起步、快速增长、平稳3 个阶段,基本代表了电力领域大数据的研究和发展趋势。

2.2 发文作者合作网络

电力大数据发文作者合作网络知识图谱如图2所示。图2 中,作者名字越大代表其在2010 年-2021 年间发文参与合作越多,节点连线显示作者间的合作情况。高合作作者从高到低排名依次为:曲朝阳(东北电力大学,9 篇)、文福栓(浙江大学,7 篇)、朱永利(华北电力大学,7 篇)、李刚(华北电力大学,6 篇)、宋亚奇(华北电力大学,6 篇)、艾芊(上海交通大学,6 篇)等。合作作者大都隶属于大学等学术机构,对电力大数据领域的态势关注度高、学术产出比较明显。以上述6名学者为节点,代表网络合作中坚力量,链接了各研究团队,学术联系比较紧密。

图2 发文作者合作网络知识图谱Fig.2 Authors’cooperative network knowledge map

2.3 发文机构合作网络

研究结构是针对某些特定研究领域不断发展的重要载体,对促进学术交流、成果共享、资源互补等起着重要的导向作用[5]。电力大数据的学术研究发文机构合作图谱如图3所示,可以看出,华北电力大学和中国电力科学研究院在电力大数据研究领域的重要程度最大,对相关研究的引领作用最明显;
大学和以国家电网有限公司以及南瑞集团、中国南方电网为代表的企业机构有着比较紧密的学术联系。

图3 发文机构合作网络知识图谱Fig.3 Cooperative network knowledge map of published papers’institutions

2.4 关键词聚类

关键词聚类有助于显示电力大数据的研究热点。聚类编号越小,代表聚类的规模越大。本文对学术文献题录的关键词聚类结果如图4 所示。可以看出,关键词聚类排名前8个类依次为:0号大数据、1号智能电网、2号数据挖掘、3号云计算、4号故障诊断、5号人工智能、6 号电力系统、7 号神经网络。这几个类基本涵盖了电力大数据的使用主体、应用方向、数据处理及分析方法。聚类结果中,S 值越接近1,表明网络的同质性越高,当S值大于0.7时,聚类结果具有高信度,本文中的S值为1。Q值大于0.3时表明聚类的社团结构显著,本文中的Q值为0.885 2。

图4 关键词聚类知识图谱Fig.4 Knowledge map of key word clustering

2.5 关键词突现

文献关键词是对研究目的、对象、方法的高度凝练和概括,而突现关键词则能够体现研究领域特定时期的主要研究主题,代表该词在短时间内激增,变成热点并被学术界所关注,可以理解为“百度指数”[6],本文的具体结果见表1。可以看出,人工智能、神经网络、机器学习在2019 年-2021 年一直保持热度,由于突现具有延续性,所以这3 个突现关键词在未来几年有继续成为前沿研究热点的可能。表1中关键词凸现结果基本与论文发表趋势章节中所分析的主题词和关键词相符合。

表1 电力大数据2010年-2021年突现关键词Table 1 Keywords emergence of power big data from 2001 to 2021

综上所述,针对电力大数据研究,在概念形成、提出、研究、应用等各个方面都有学者、大学、研究机构、企业的参与和贡献。从文献发表年度变化趋势、主题词呈现、关键词聚类和关键词突现,可以看出电力大数据的内涵和外延一直在不断丰富、扩大,相关研究在不同时间、不同层面贯穿了电力数据产生、处理和应用全流程,具体如图5所示。

图5 电力大数据采集分析应用框架简图Fig.5 Acquisition, analysis and application framework of power big data

3.1 电力大数据采集应用流程特点

1)数据产生层主要是电力大数据的采集融合和存储管理。电力大数据通过硬件和软件被采集之后需要高效存储。目前,传统的结构化数据多由图5 中的内部数据源提供,通常借助感知设备采集并集成,采用MySQL、Oracle、MongoDB 等数据库存储;
以图片、视频为代表的半结构化数据、用户评价反馈为代表的非结构化数据,大多来源于外部数据源(见图5),相比结构化数据具有更高的复合增长率,这些数据常被NoSQL型分布式数据库(如BigTable、Dynamo)、HDFS 分布式文件系统存储[7]。结构化数据在电力产业发展初期[8]通常采用以集中式架构为主的实时数据库存储,但随着半结构化数据、非结构化数据的快速膨胀,可扩展性和稳定性较强的分布式架构以及目前比较流行的云存储多被使用。众多主体对电力大数据的采集和存储方式不尽相同,且由于部署时间和管理理念的不同,表现出数据采集管理手段不协调、精准高效监视办法缺少、基础数据质量不统一、运维需求跟不上等问题[9]。

2)数据处理层主要是数据分析与挖掘,具有两个特点:一是数据处理架构种类多。电力大数据处理架构包括Hadoop 分布式系统架构、Openflow 系统架构、阿里云、GAIA 分布式数据管理平台、分布式Redis 等,这些架构部署在不同电力主体中,总体上满足了企业的发展需求,但也面临着迁移困难、技术难度大、学习成本高等问题[10-11]。二是数据处理方法多样。各种算法如分类算法、关联分析、聚类算法、神经网络、融合算法和集成模型的使用,提高了数据处理的准确度和效率,适配了业务需求,但这些算法强烈依赖于数据类型和平台架构,在计算开销、时效性、抗干扰能力等方面存在不等数量的缺陷,普适、可迁移的机器学习技术、核心层的数据调度算法等基于更先进理念、算法的大规模部署和应用需要持续推进[12]。

3)在数据应用层,有两大主要服务方向。

一是社会治理与经济运行方向。典型的社会治理应用实例,如全社会用电量数据关联影响国家宏观经济及政策调控,工业和居民用电需求变化标志国民经济总体态势[13],产业用电数据互馈区域规划调整,电力设施和电网智能化动态平衡电力供需、支持城市管理,大数据可视化助力防灾减灾[14]、安全风险监管等。

二是电力行业、企业运行与管理方向。在发电侧,传统的煤电、气电行业可以根据社会用电量和电网负荷需求,实时、高效、灵活调整机组负荷,充分发挥“稳定器”作用,而多元化新能源和可再生能源占比增大且将逐步成为主体电源,联动大数据助力协调配置资源、提升电网容量组成,促进清洁能源消纳[15];
在输电环节,发现并减少电力损耗节点、分析评估系统暂态稳定性、输电设备状态[16];
在配电环节定位配电网故障[17]、管理配电网负荷、识别故障类型;
在变电环节智能巡检变电设备、辅助变电运维和检修[18];
在调度侧挖掘用电需求增长点、均衡负载。“输配变调”各环节高效运行,优化电力网络网架、提升电力系统的整体经济性。在用户侧,分析规划用电行为,获得最佳体验、最优增值服务并促使电力供应主体改进服务模式,定制个性化体验。在运营服务侧,分场、多维度建立用户画像,描述用电偏好,改善组织营销,协助用户智能用电,推动绿色生活,实现供电和用电双赢[19]。

3.2 电力大数据重点应用领域

1)大气治污

大气污染防控领域,“电力大数据+环保监管”模式在支持保障精准、科学、依法治污方面具有显著优势,其“监控”功能在源头上诊断发现企业环保治理设施运行状态、判断企业是否按照大气污染防治应急预案执行限停产措施,其“预防”功能在数据挖掘的基础上辅助政府部门精准、科学地制定应对气候变化长期预案,实时规划、调整与大气环境相关的产业轮动政策[20-21]。

2)电力环保

在火电环保治理领域,通过大数据深层挖掘火电环保治理设施的运行数据,结合人工智能和机器学习等技术,进一步优化物耗、能耗、故障诊断、智能问答等应用侧发展方向。此外,基于大数据的知识图谱问答系统,以及综合了数据采集、处理、检测、预警和优化功能的火电厂环保岛系统,可以帮助电厂运行人员做出事前决策,提升发电企业的智慧化运行水平。在新能源应用消纳领域,风电并网运营、光伏发电规划,潮汐、地热能等多能互补的微电网构建,电力大数据也将发挥逐渐重要作用并凸显其环保属性[22]。

3)负荷预测

基于大数据的电力负荷预测技术,对供电方、输配变中间网络、终端用户的作用都十分重要,是电力供需平衡的保证[23]。社会电力资源量的需求受到气候变化、社会环境变化、产业变动等因素的影响而时刻处于变化中,客观上也对促进了负荷预测的电力全产业链覆盖。高准确度的负荷预测支撑供电方合理安排调度、降低成本。输配变中间网络通过大数据对企业供电能力预测、终端用户耗电需求的高效预测,进而有效平抑电网波动、提升电能质量、提高系统效率,并延伸服务终端用户合理分配峰谷用电负荷、稳定安全用电,提升用电满意度。产业和居民用电终端自身耗电负荷预测反馈上游环节,既满足自身用电需求也促进电力产业链的健康发展。

4)能源互联网

能源互联网借助统一的能源数据平台,以多能融合突破孤立系统的边界,用开放的框架联接能源的产生、传输、储存、消费等节点,集成多源能源数据和技术服务,通过信息和通讯技术管理和控制能源[24],实现电力系统的纵横整合与协同,扩大资源优化配置空间。由国家电网有限公司于2015 年初提出、“互联网+”与大数据融合创新的典型代表—“全球能源互联网”,对多元数据(如燃气、热力、发电厂、电网等的数据)和经济、气候等数据进行快速整合分析,着力提升能源供应效率、实现互联网与可再生能源的融合和全球能源互享[25]。受《关于推进电力源网荷储一体化和多能互补发展的指导意见》等相关制度鼓励和当前国际国内能源领域清洁、低碳发展的影响,大规模部署、应用的风光储、风光水(储)、风光火(储)等一体化多能互补项目,客观上正在并将极大促进、丰富能源互联网的发展内容[26-27]。

3.3 电力大数据存在问题与对策

1)电力行业知识系统建设不完善,系统之间和企业之间数据共享不充分[28]。首先,电力大数据在应用端主要是以电力相关企业为主,构建的知识系统多偏向于业务方向,融合基于外部数据源的知识系统存在困难,且大多企业数据管理、研发技术能力相对薄弱。其次,电力行业信息系统来源于不同的主体,各主体的知识系统开发时间、操作平台、系统模型、数据格式不完全相同,依据的标准、管理体制也不尽相同,相互的生产、调度在数据交换、共享上存在困难。

2)电力行业大数据资源存在安全风险,保障体系需要完善。一方面是有数据泄露风险,相关主体要警惕电力大数据开发、分析、应用过程中的数据投毒、深度伪造等威胁,以及过度采集、隐私泄露和滥用等风险,在采用隐私保护计算、数据加密技术、私有云等技术手段之外,还要在制度因应上做出规划,如针对云共享数据建立完善的隐私感知公共审计机制等措施。另一方面电力大数据容易成为网络攻击目标。规模庞大、实时不间断的电力数据在采集和传输的过程中,控制失效、中间环节被人为篡改或虚假数据注入、泄露都会产生巨大的负面影响。不法分子对电力数据的窃取、攻击、恶意传播也会冲击电力系统稳定、引发安全事故,因此要建立防范外部不安全行为的防御机制和应对措施,准备必要时积极防御策略。

3)针对上述问题,可采用的对策为:一是加强电力行业知识系统、电力数据共享中心建设、统一电力行业数据标准和非电行业数据接入标准,跟进并完善相关法律规制;
二是对数据采集、传输、存储、处理和应用建立全流程安全监管措施,构建安全策略、模式和环境,细化完善安全保障体系,提升数据相关方的安全防护意识和风险应对能力。

本文数据库检查的关于电力大数据的部分相关文献信息,借助文献计量手段,研究了电力大数据在学术领域近11年的研究情况,构建了电力大数据应用流程框架简图,简述了电力大数据的来源、处理架构和算法、应用场景,讨论了相关的重点应用领域和面临的问题,对电力大数据的研究分析有一定的参考价值。

1)电力大数据在文献学术领域的研究从2013 年开始显著增长,广大学者和大学、电力企业均在电力大数据的学术和应用领域有深度的参与和合作。

2)电力大数据在未来将以人工智能、神经网络、机器学习为重点研究方向,并服务大气治污、电力环保、负荷预测、能源互联网等重点业务领域。

3)电力大数据在电力生产和电能使用的各环节仍需继续加强研究、合作共享,并需要注重数据安全治理。

猜你喜欢聚类文献研究FMS与YBT相关性的实证研究体育科技文献通报(2022年3期)2022-05-23Hostile takeovers in China and Japan速读·下旬(2021年11期)2021-10-12辽代千人邑研究述论辽金历史与考古(2021年0期)2021-07-29视错觉在平面设计中的应用与研究科技传播(2019年22期)2020-01-14Cultural and Religious Context of the Two Ancient Egyptian Stelae An Opening Paragraph大东方(2019年12期)2019-10-20基于K-means聚类的车-地无线通信场强研究铁道通信信号(2019年6期)2019-10-08EMA伺服控制系统研究民用飞机设计与研究(2019年4期)2019-05-21The Application of the Situational Teaching Method in English Classroom Teaching at Vocational Colleges科学与财富(2017年22期)2017-09-10基于高斯混合聚类的阵列干涉SAR三维成像雷达学报(2017年6期)2017-03-26The Role and Significant of Professional Ethics in Accounting and Auditing商情(2017年1期)2017-03-22

Tags: 热点   计量   文献  

搜索
网站分类
标签列表