职场文秘网

首页 > 心得体会 > 学习材料 / 正文

智能化煤矿数据归类与编码实质、目标与技术方法

2023-05-03 10:15:08

谭章禄,王美君

(中国矿业大学(北京)管理学院,北京 100083)

数据治理是阻碍智能化煤矿高级阶段发展目标实现的关键瓶颈[1-3]。数据归类与编码是智能化煤矿数据治理首要的关键活动[4],是智能化煤矿数据治理与融合共享标准体系的关键组成部分[5-6]。数据归类与编码基于数据所描述的对象特征,面向数据治理和数据应用需求,对数据元进行识别归并、有序组织、赋予标志代码,使得数据在语义理解上无歧义,保证数据组织、数据存储、数据交换和数据共享的一致性。智能化煤矿数据具有数据对象丰富、数据属性多样、数据关联性强、数据来源分散[7]、数据结构复杂等典型特征。智能化煤矿的数据特征决定智能化煤矿数据归类与编码是伴随数据全生命周期的推进智能化煤矿数据归类与编码标准质量螺旋式提升[8]的一项长期、动态、复杂的系统性工作,将引导智能化煤矿数据架构进行全局逻辑优化。因此,智能化煤矿数据归类与编码的最佳实践需要科学的方法论进行指导。

关于智能化煤矿数据归类与编码的理论研究和实践探索尚不成熟。曹代勇等[9]关于煤地质学元数据标准的研究较早开启了煤矿数据标准化建设。潘涛等[10]初步探讨了数据元的概念和描述方法,并提出了数据集分类与编码的基本方法。杜毅博等[11]在分析煤炭数据特征后,提出了一种基于位号的数据编码方案。王国法等[12-14]在深入研究智能化煤矿、智能化采煤工作面等分类分级标准后,提出了智能化煤矿的数据逻辑模型,并面向透彻感知构建了煤矿数据架构。然而,智能化煤矿数据归类与编码尚未形成完善的方法论体系,亟待对智能化煤矿数据归类与编码的实质、技术目标、技术原则与关键技术流程等进行深入研究。

本文首先揭示智能化煤矿数据归类与编码的实质,进而阐明智能化煤矿数据归类与编码的目标和原则,最后系统性地提出智能化煤矿数据归类与编码的技术方法,以期完善智能化煤矿数据归类与编码的方法论体系,为智能化煤矿数据归类与编码提供技术实现路径。

智能化煤矿是由煤矿的意识世界、物理世界和信息世界构成的协调统一的有机整体[15],如图1 所示。在智能化煤矿初级阶段,由于煤矿智能化标准、数据治理体系、煤机装备网络化智能化改造、煤矿管理决策模型、煤矿人工智能算法等关键技术发展不平衡、不充分,煤矿不完全具备透彻感知、深度互联的结构特征和自主学习、智能应用的功能特征,初步达成自动化减人的建设目标,业务实现需要意识世界的指挥干预,尚不能完全实现以数据驱动的柔性生产和精益管理。在智能化煤矿高级阶段,信息世界具备自主学习能力,可根据意识世界的战略愿景和意图,自动实现目标分解和任务划分,通过透彻感知和数据驱动促成物理世界业务目标的实现,达成智能化无人的建设目标。

图1 智能化煤矿建设进程Fig.1 Construction process of intelligent coal mine

智能化煤矿高级阶段的实现以三大根本任务的完成为保障[1]:①构建煤矿信息世界。② 改造煤矿意识世界和物理世界。③搭建3 个世界互联互通的信息通路。构建煤矿信息世界的前提是对煤矿意识世界和物理世界的价值发现和客观描述。煤矿信息世界的构建不是煤矿意识世界和物理世界的简单复制,首要任务是挖掘煤矿意识世界和物理世界中存在的价值对象(体现为资源或资产)和价值创造活动(体现为竞争能力),其次是对煤矿价值对象和价值创造活动进行客观描述,最终实现对煤矿意识世界和物理世界的数字映射。煤矿意识世界的改造以信息世界的价值发现为驱动,聚焦关键价值活动,重塑商业模式,优化组织结构,推动文化制度创新,以适应煤炭行业高质量发展要求和数字化发展趋势。煤矿物理世界的改造则在意识世界改造的引导下,逐步实现与信息世界建设的协同,重在信息基础设施和煤机装备的网络化、数字化和智能化改造。要搭建3 个世界互联互通的信息通路,其基础在于人与人、人与机器、机器与机器进行信息交互时通过唯一编码交换数据,并对交换的数据达成一致的语义理解,以保证数据传输的一致性。

智能化煤矿数据归类与编码通过对煤炭产业生态链、煤炭企业价值链、关键价值活动等的梳理,发现煤炭企业价值创造的核心资源和核心能力;
通过业务流程和数据流程梳理,优化业务实现逻辑,提高业务效率;
进一步对煤矿所有数据对象及数据属性按专业逻辑和数据治理技术要求进行有效组织并赋予唯一标志代码,实现煤矿意识世界和物理世界向煤矿信息世界的迁移和同步,奠定煤矿信息世界的数据底座,保证数据全生命周期交换共享的一致性。在实质上,智能化煤矿数据归类与编码是对智能化煤矿信息世界的认识和构建,对智能化煤矿意识世界的优化和映射,以及对智能化煤矿物理世界的改造和描述,最终指向智能化煤矿数据治理目标的实现、智能化煤矿生产力的提升和智能化煤矿的高质量发展。

智能化煤矿数据归类与编码的目标由总体战略目标、经营战略目标和职能战略目标构成。

(1)在总体战略上,推动煤炭企业商业模式重塑,解决煤炭企业数据资源配置及资源协同问题。在识别煤矿数据对象和数据属性的过程中,一方面发现煤炭企业价值创造的核心资源和核心能力,使数据资源配置于高附加值业务,逐步淘汰低附加值业务,并促进煤炭数据产品、煤矿管理决策模型产品、煤矿人工智能算法产品等的开发和拓展;
另一方面明确煤炭数据的服务场景和业务需求,以数据驱动为核心,从煤矿智能化建设全局角度设计煤矿生产、安全、管理等业务的协同策略。

(2)在经营战略上,改变煤炭企业价值创造的驱动模式,聚焦关键价值活动,优化组织结构,推动煤炭企业降本增效竞争战略的实现。通过全面分析煤炭业务流程和数据流程,一方面深刻揭示煤炭企业关键价值创造活动和关键业务的数字驱动模式,以智能化提高作业效率;
另一方面推动煤炭生产作业方式的改进,并进一步优化组织架构,以实现减人或无人,降低产品成本。

(3)在职能战略上,聚焦于智能化煤矿数据的科学组织,奠定智能化煤矿数据治理与融合的基础,推动智能化煤矿数据集成和系统集成。智能化煤矿数据的科学组织具有4 个层面的含义:①明确智能化煤矿数据需求,洞悉数据来源、数据产生规则和数据应用要求。② 全面识别并科学描述煤矿数据对象。③对数据对象的本质属性进行全面抽取和规范表达。④ 在语义上赋予数据统一理解,确定数据元概念和数据元表示。

为了确保智能化煤矿数据归类与编码不同层次技术目标的实现,合理确定数据归类与编码的技术依据和标准,智能化煤矿数据归类与编码需要遵循科学性、规范性、完整性、唯一性、有效性的基本原则。科学性原则是指应选择煤矿数据对象最稳定的本质属性作为分类的基础和依据,并按科学的认知逻辑形成层级清晰、结构简单且符合智能化煤矿业务逻辑、数据建模逻辑和系统开发逻辑的分类编码体系。规范性原则有2 层含义:①同一层级数据包含的数据实例的外延相同。② 编码的结构、类型和编码格式等应当统一。完整性原则是指针对煤矿价值创造共性业务中的数据对象、本质属性和数据元,要实现数据需求全发现、数据对象全识别、数据属性全抽取及数据元全定义。唯一性原则具有3 层含义:①智能化煤矿中的任一数据对象、数据属性、数据元具有唯一确定的位置。② 智能化煤矿中的所有数据对象、数据属性和数据元被唯一代码标志。③被唯一代码标志的智能化煤矿数据对象、数据属性和数据元具有唯一规范的数据定义。有效性原则包含3 层含义:①面向智能化煤矿未来业务场景和业务需求,具备可拓展的数据归类和编码空间。②智能化煤矿数据归类与编码具备兼容性,能与相关国家标准和国际标准良好衔接。③智能化煤矿数据归类与编码的运行经济高效,能有效节约智能化煤矿有限的网络资源、存储资源和计算资源,符合智能化煤矿业务应用需求,便于机器识别与检索。

3.1 智能化煤矿数据归类的基本思路

智能化煤矿宜采用“基准-扩展”两阶段的数据归类思路。

第1 阶段采用“业务域-数据域-对象-属性-数据元”的逻辑顺序确定智能化煤矿数据的归类基准。首先通过价值链分析识别智能化煤矿创造价值的关键业务活动;
其次采用UML,IDEF 等规范化数据建模工具对关键业务活动进行业务流程分析和数据流程分析(必要时可进行用例分析、活动分析、状态分析、时序分析、类分析等),识别现有业务的数据需求,确定智能化煤矿业务域;
然后对各业务域进行工艺流程或管理职能分解,将业务域映射为数据域;
接着在数据域下依据智能化煤矿的工艺环节或管理环节进行数据对象识别和对象属性抽取;
进一步依据数据服务的专业业务逻辑,规范数据元语义;
最终确定智能化煤矿数据归类基准。

第2 阶段采用“智能应用体系-智能业务系统-系统功能-数据资源”的逻辑顺序进行数据归类校验和补充。充分考虑当前智能化煤矿建设基础,并面向智能化煤矿未来的智能应用场景,采用德尔菲技术,以饱和的专家观点逐步构建完备的智能化煤矿智能应用体系,反推智能化煤矿应建设的智能化业务系统,再反推各智能化业务系统应集成的系统功能,进一步反推各系统功能需要的数据支持,追溯现有数据源,对第1 阶段形成的数据归类基准进行校验并对缺失的数据进行补充,至此形成完善的智能化煤矿数据归类体系。

由于对煤矿智能化发展进程的认识具有历史局限性,煤矿智能化建设具有过程性,煤矿的智能应用体系尚处于结构完善和内容丰富的阶段,对支持煤矿智能应用所需的数据元无法一次性全面、准确识别,智能化煤矿数据归类与编码体系的完善是螺旋式上升的过程,应按PDCA(Plan,Do,Check,Action,计划,执行,检查,处理)循环逐次提取业务逻辑清晰、标准化程度高、对价值提升具有重要意义的业务活动数据,以保持煤矿智能应用体系发展的创新活力和智能化煤矿数据归类与编码体系的稳定性及可扩展性。

3.2 智能化煤矿数据编码的基本思路

智能化煤矿数据编码是在智能化煤矿数据归类体系的基础上,对智能化煤矿各层级数据进行系统性编码的过程。根据智能化煤矿数据归类与编码基本原则,智能化煤矿数据编码宜采用线分类的层次编码方法[16](图2),将智能化煤矿数据划分为门类、大类、中类和小类4 个层级,代码由1 位拉丁字母和7 位阿拉伯数字组成。

图2 智能化煤矿数据编码结构Fig.2 Data coding structure of intelligent coal mine

智能化煤矿数据门类为基于煤炭企业价值链分析划分的业务域,代码用1 位拉丁字母表示,即用A,B,C,D 等字母依次表示不同的数据门类。智能化煤矿数据大类为按照工艺流程或管理职能划分的数据域,代码用2 位阿拉伯数字表示,各数据大类从01 开始顺序编码。智能化煤矿数据中类为依托工艺环节或管理环节分析而识别的数据对象,代码用5 位阿拉伯数字表示,前2 位为大类代码,第3-5 位从001 开始顺序编码。智能化煤矿数据小类为通过数据对象分析抽取的对象属性,代码用7 位阿拉伯数字表示,前5 位为中类代码,第6 位和第7 位从01 开始顺序编码。

3.3 智能化煤矿数据归类与编码的关键技术流程

智能化煤矿数据归类与编码总体上可以归纳为确定业务域、确定数据域、识别对象类、抽取对象类属性、定义数据元5 个关键步骤。

(1)确定业务域,完成第1 层级数据归类与编码。确定业务域的目的是确定智能化煤矿数据的业务来源,划定数据范围,保证关键价值创造活动和数据需求的全面发现,进行智能化煤矿数据的语用过滤。基于价值链分析,智能化煤矿关键价值创造活动包括地质保障、智能掘进、智能采煤、智能主煤流运输、智能辅助运输、智能洗选、综合保障、智能生产调度与管理、智能安全监控与管理、运输销售、矿区修复等基本增值活动,以及煤炭企业基础结构与组织建设(企业资质、煤层勘探、矿井设计与基建、组织结构设计、管理制度建设等)、信息基础设施建设、人力资源管理、财务管理、法务管理、项目管理、机电设备管理、科学技术开发与管理、物资供应管理、环保管理、智能园区管理、党政工团管理等辅助增值活动,如图3 所示。基于企业价值链分析确定智能化煤矿业务域的过程,同时也是对智能化煤矿商业模式、组织架构、管理模式、生产方式、业务逻辑、作业程序等进行全盘摸底和效率检验的过程,有助于达成智能化煤矿数据归类与编码的总体战略目标和经营战略目标。

图3 智能化煤矿关键价值创造活动Fig.3 The key value creation activities of intelligent coal mine

根据智能化煤矿的业务架构和业务组织逻辑,可将智能化煤矿的关键价值创造活动划分为基础设施、经营管理、安全监控与管理、智能生产与管理4 个业务域,依次赋予字母代码A,B,C,D,由此完成智能化煤矿第1 层级数据的归类与编码。

(2)确定数据域,完成第2 层级数据归类与编码。数据域的确定既要关注数据的有效组织,也要符合煤炭企业业务实现逻辑,将与业务关联密切的数据划分到同一数据域下,以增强对数据的统一理解,便于数据模型开发和系统集成。针对基础设施业务域,根据智能化煤矿业务开展的必要条件划分,具体包括企业资质、煤层勘探、矿井设计与基建、组织结构、管理制度、信息基础设施等数据域。针对经营管理业务域,根据智能化煤矿经营管理的职能划分,具体包括人力资源管理、财务管理、法务管理、项目管理、机电设备管理、科学技术开发与管理、物资供应管理、运销管理、环保管理、矿区修复、智能园区管理、党政工团管理等数据域。针对安全监控与管理业务域,根据业务类型划分,具体包括瓦斯监控、水文监控、火灾监控、粉尘监控、矿压监控、冲击地压监控、人员定位监控、工业视频监控与电子围栏、通信联络与广播、应急救援与指挥、煤矿安全双重预防管理等数据域。针对智能生产与管理业务域,根据工艺流程划分,具体包括地质保障、智能掘进、智能采煤、智能主煤流运输、智能辅助运输、智能洗选、智能通风、智能压风、智能供水、智能排水、智能供电、智能生产调度与管理等数据域。

根据智能化煤矿数据编码规则,可对基础设施、经营管理、安全监控与管理、智能生产与管理4 个业务域下的各数据域进行2 位数字的顺序编码,如安全监控与管理业务域下的瓦斯监控数据域可赋予代码C01,由此完成智能化煤矿第2 层级数据的归类与编码。

(3)识别对象类,完成第3 层级数据归类与编码。智能化煤矿各数据域下的数据对象可从组织、人员、机器、环境、管理5 个方向按照一定的逻辑顺序逐一识别。基础设施业务域下各数据域的数据对象可按照智能化煤矿业务开展的必要基础条件进行识别,如企业资质数据域下的数据对象主要包括营业执照、采矿许可证、安全生产许可证、煤炭生产许可证、矿长资格证、矿长安全生产许可资格证等管理类的数据对象。经营管理业务域下各数据域的数据对象可按照管理环节进行识别,如人力资源管理数据域下的数据对象包括人力资源规划、招聘与人员配置、培训与开发、绩效管理、薪酬福利管理、职业健康管理、劳动关系管理等环节的人员类和管理类数据对象。安全监控与管理业务域下各数据域的数据对象可按照煤矿安全作业流程进行识别,如瓦斯监控数据域下的数据对象主要包括瓦斯监测传感器、瓦斯、瓦斯监测报表等数据对象。智能生产与管理业务域下各数据域的数据对象可按照工艺环节进行识别,如智能采煤数据域下的数据对象主要包括采煤工作面、作业班组、作业规程及割煤、支护、供液、运输、工作面巷道集控等工艺环节的机械设备。

根据智能化煤矿数据编码规则,可对各数据域下的数据对象进行5 位数字的顺序编码,如安全监控与管理业务域下瓦斯监控数据域的瓦斯对象可赋予代码C01001,由此完成智能化煤矿第3 层级数据的归类与编码。

(4)抽取对象类属性,完成第4 层级数据归类与编码。对象类属性是指智能化煤矿数据对象与关键价值创造活动紧密相关且稳定的本质属性,用于区别其他数据对象,如管理类数据对象的属性一般仅包含管理活动关注的特征,而不包含管理对象的特征。智能化煤矿数据对象属性可按数据特征分为配置属性、静态属性和动态属性3 类。配置属性是指数据对象运行需要配置的工作条件、运行环境及与数据交换有关的属性,如安装位置、安装时间、数据传输频率等。静态属性是指数据对象固有不变的属性,如设备的名称、生产厂家、型号、序列号、组成结构等。动态属性是指数据对象随时间变化的属性,如温度、浓度、电流、转速等。在抽取对象类属性时需要合理考量业务实现逻辑、系统集成逻辑、数据建模逻辑及数据权属关系,科学有效地进行对象属性的本质甄别和合理归类。

根据智能化煤矿数据编码规则,可对各数据对象的属性进行7 位数字的顺序编码,并按照配置属性、静态属性和动态属性的顺序进行排列,如安全监控与管理业务域下瓦斯监控数据域的瓦斯对象的瓦斯浓度属性可赋予代码C0100101,由此完成智能化煤矿第4 层级数据的归类与编码。

(5)定义数据元,达成对数据的统一理解。为了在数据交换和数据共享时对数据元形成统一理解,需要赋予数据元准确的语义,进行智能化煤矿数据的语义过滤。数据元是信息集中数据元素的规范化表达,是数据管理和数据交换的最小基本单元,由数据元概念和数据元表示2 个部分组成[17]。数据元概念由对象类和属性构成。数据元在数据应用上与主数据相关联,主数据是支持智能化煤矿关键价值创造活动的关键数据对象的高价值、基础性、高质量、高共享、可集成的数据元,数据元成为主数据需要依据主数据标准执行主数据识别程序。数据元在数据管理上与元数据相关联,元数据是客观描述智能化煤矿数据元的业务属性、技术属性和管理属性的数据,数据元表示是业务元数据的重要组成部分。

合理确定数据元表示是定义数据元的关键。除一般意义上的数据元表示元素外,在定义数据元时还应结合业务域、数据域和对象类的业务规则清晰界定对象属性的内涵和外延,避免理解偏误和歧义。智能化煤矿的数据属性具有强关联的时间和位置特性。智能化煤矿数据元(尤其是动态属性)的表示有必要考虑时间戳和位置戳这2 个元素。时间戳基于数字签名和数字加密技术,赋予数据完整的可验证性时间标记。位置戳基于矿山位置服务和数字加密技术,赋予数据可信的位置信息标记。主数据是智能化煤矿数据治理、数据管理和数据应用的重要基础性工具,在智能化煤矿数据元表示中有必要考虑主数据标记。主数据标记反映主数据识别程序的判定结果,将数据元识别为主数据后,将其纳入主数据体系进行管理和应用。智能化煤矿数据元表示规则(表1)的确定标志着智能化煤矿数据归类与编码的最终实现。

表1 智能化煤矿数据元表示规则Table 1 Data element representation rule of intelligent coal mine

智能化煤矿数据归类与编码是对智能化煤矿信息世界的认识和构建,对智能化煤矿意识世界的优化和映射,以及对智能化煤矿物理世界的改造和描述,对于推动煤炭企业商业模式重塑、改变价值创造驱动模式、聚焦关键价值活动、实现智能化煤矿数据的科学组织等具有重要意义。本文从分析智能化煤矿高级阶段目标实现进程中数据归类与编码要解决的核心问题出发,阐明智能化煤矿数据归类与编码的实质,从总体战略目标、经营战略目标和职能战略目标3 个层面分析了智能化煤矿数据归类与编码的目标要求,指出智能化煤矿数据归类与编码需要遵循科学性、规范性、完整性、唯一性、有效性的基本原则,进一步提出智能化煤矿数据归类与编码的基本思路,最后论述智能化煤矿数据归类与编码的关键技术流程及需要关注的重点问题。智能化煤矿数据归类与编码关乎煤炭企业数字化转型和高质量发展全局,是智能化煤矿数据治理的首要关键活动,是智能化煤矿数据治理与融合共享标准体系的关键组成部分。智能化煤矿数据归类与编码具有基础性、长期性、动态性、复杂性和系统性,需要煤炭产业生态中的各主体在国家有关部委的领导下,以科学的技术方法论为指导,扎实推进智能化煤矿数据归类与编码工作,奠定煤炭工业数字化发展的数据底座,共享煤炭产业数字化转型红利。

猜你喜欢归类编码对象电表“对”与“错”归类巧掌握中学生数理化·中考版(2021年10期)2021-11-22涉税刑事诉讼中的举证责任——以纳税人举证责任为考察对象湖南税务高等专科学校学报(2021年4期)2021-08-30基于SAR-SIFT和快速稀疏编码的合成孔径雷达图像配准四川轻化工大学学报(自然科学版)(2021年1期)2021-06-09《全元诗》未编码疑难字考辨十五则汉字汉语研究(2020年2期)2020-08-13子带编码在图像压缩编码中的应用电子制作(2019年22期)2020-01-14Genome and healthcare疯狂英语·新读写(2018年3期)2018-11-29Happiness through honorable actions疯狂英语·新读写(2018年2期)2018-11-29攻略对象的心思好难猜意林(2018年3期)2018-03-02分式方程应用题归类解说中学生数理化·七年级数学人教版(2017年12期)2017-04-18基于熵的快速扫描法的FNEA初始对象的生成方法厦门理工学院学报(2016年1期)2016-12-01

Tags: 智能化   归类   煤矿  

搜索
网站分类
标签列表