职场文秘网

首页 > 心得体会 > 学习材料 / 正文

公务员数据素养的概念、结构与测量*

2023-05-07 20:40:11

张红春 杨涛

(贵州大学公共管理学院,贵阳 550025)

数据与信息是国家治理的行动前提[1]。随着大数据、人工智能、物联网、云计算、区块链等数字技术深度嵌入治理过程以及政府数据基础设施的完善,政府治理的数据条件显著改善,但同时也带来数据过载、数据失真、数据安全等数据治理挑战。在此背景下,如何有效治理数据成为一个重要的政府治理议题[2]。公务员群体是政府数据资源的操作者和使用者,其工作环境中的数字技术产品迭代更新,工作中充斥着海量的数据资源,致使公务员更容易落入“能力堕距”。在政府数智化转型过程中,技术、制度因素以外的治理主体的素质会深刻影响国家治理的效能[3],因此更要重视人的能力配位。但就目前的研究来看,公务员数据能力与技能系统的短缺是制约政府大数据治理转型的短板[4-5]。

在实践层面,数据素养这一议题已经引起国内外政府的重视。2021年11月,我国印发了《提升全民数字素养与技能行动纲要》。国际上,英国发布实施了数据能力战略,美国率先在公私部门实施了首席数据官制度,澳大利亚、挪威、日本等国家的数据素养正被纳入国民教育范畴。在学术领域,国内外对数据素养议题的讨论较为丰富,但对公务员的数据素养还缺乏关注。21世纪,科研人员、教师、学生、图书馆馆员等特殊群体的数据能力备受关注,主要集中在图书情报、教育学、工商管理等领域。而在公共管理领域,虽然大数据治理、数字政府治理、数据开放等研究主题成为学科热点,但是既有研究重心往往偏向于宏观层面制度、组织与技术的供给,缺乏对公共治理主体数据能力的直接研究。鉴于这一重要研究缺项,本研究旨在回答公务员数据素养应包括的内容以及如何建构能胜任政府数据治理的公务员能力框架与要素。

当下,数据驱动的决策成为社会运行的主流范式。在此背景下,数据素养成为提升决策合理性的重要条件,逐渐受到关注。数据素养的概念最早可以追溯到Shields[6]的研究,其认为数据素养是人获取、整理、归纳和总结数据并在此基础上推断结论的能力。总体而言,数据素养研究大体上沿着以下3条路径展开。

(1)数据素养的概念内涵辨析。描述性的数据素养概念探讨屡见不鲜,目前尚未形成公认的定义。一个较有说服力的定义是:数据素养是理解数据和有效利用数据进行决策的能力,包括知道怎样辨别、收集、组织、分析、总结以及优化数据[7]。在概念关系上,数据素养被认为是信息素养的拓展、变种或核心内容[8],并且数据的本质性和基础性特征使得它与“媒介素养”“数字素养”等其他信息技术素养产生关联。总体来看,数据素养因其面向数据活动而具有特定的概念指向,学术界也主要从胜任数据任务来理解数字素养。沈婷婷[9]形象地将数据素养比喻为对数据的“听、说、读、写”能力。

(2)数据素养的结构模型。面向图书馆馆员、教师等专业人员和学生等主体的数据素养模型不断涌现[10-11],这些研究多基于数据生命周期对数据素养加以建构和表达,通常有两种视角。一是侧重作为数据管理的数据素养,认为数据素养从属于科学数据管理范畴,即数据管理流程所涉及的数据收集储存、转换、分析、应用等各环节所涉要素的聚合组构[7,12],强调数据过程的标准化和精细化,具有明显的过程导向性。二是作为数据利用的数据素养,以数据信息利用为深层架构逻辑,关注人员的数据信息利用行为和问题的发现、解决[13],尤其是利用数据驱动决策是数据素养的本质所在[14],不仅要具备数据获取、分析技能等显性能力,数据意识、批判性态度、伦理道德等隐性素养也至关重要[15-16]。显然,以综合的视角来看待数据素养模型更加稳妥和全面,既要考虑胜任数据管理任务的知识、经验和技能,还要具备数据嵌入工作与决策的应用能力。

(3)特定群体的数据素养测量。不少学者尝试针对各自领域的职业人员数据能力需求,进行数据素养评价体系的开发。从评价内容上来看,Mandinach等[7]开发的评价体系较为系统地总结了数据管理利用所需的能力素质,并得到广泛的认可和沿用。不少研究对其加以调整或融入对具体对象的数据能力要求,进行数据素养测评依据的二次开发。如隆茜[17]构建了高校师生数据素养能力评价体系,包含数据的获取、处理与分析、交流、评价、道德、意识6个维度和若干具体指标。毕达天等[18]进一步解释了数据素养的影响因素。从开发思路上看,以自上而下模式的测量和评价工具开发居多,而自下而上思路较为少见。如Dunn等[19]基于社会学习、计划行为等理论,设计了数据关注度、数据知识和数据效能感3个维度的教师数据素养测量工具。总体而言,面向不同领域、不同职业的数据素养测量途径存在差异,而且数据素养水平存在不同,这表明不同职业群体面临不同的数据场景和素质需求。

具体到公共部门领域,关于公务员数据素养的概念、理论模型与测度研究几乎没有。在信息技术嵌入政府治理的背景下,学界提出了公务员“数字领导力”“信息技术能力”“媒介素养”“大数据素养”等概念与能力要求[20-21],认识到了公务员数据意识、能力等对数据治理的重要性[22],但是研究的针对性和系统性还有待提高。

总体而言,数据素养的研究仍在发展中,而公务员数据素养更是一个有待研究的议题。既有研究为讨论公务员数据素养提供了先验铺垫,但研究局限性非常明显。首先,既有国内数据素养研究主要以引介和迁移已有理论框架、测评标准和实践案例为主,有待增强根植具体情境或实践经验的理论建构与实证检验;
其次,虽然数据素养测量模型和指标众多,但是测度的结构维度、层次划分、要素设置仍然缺乏共识;
最后,随着政府治理信息化、数据化和智能化的深度转型,政府数据治理与能力建设研究文献增多,但是多从制度、组织、技术等宏观要素层面展开,缺乏对公务员这一微观主体的数据适应能力的讨论。本研究通过探究公务员数据素养概念的结构、要素及其测量问题,论述公务员如何胜任日益复杂的数据治理活动。

2.1 研究方法与思路

为了从理论层面建构公务员数据素养的概念结构与维度,并从经验层面开发公务员数据素养的测量工具,采取质性研究与量化研究设计互补的研究途径。就现实层面来看,数据的泛在性和数据行为的普遍性使得公务员数据素养成为一个经验性话题。为此,采用Glaser等[23]提出的扎根理论方法,即立足经验证据,自下而上地对原始访谈进行逐级编码、译码,归纳和提炼概念范畴及其内在机理,进行理论建构。据此,面向G省选取不同职能部门、不同层级从事数据治理活动的公务员,对其进行深度访谈,收集其胜任数据治理活动的能力要求的一手资料。经过开放式编码、选择性编码和理论性编码3个步骤,探析公务员数据素养概念内涵,提炼并范畴化其内在结构,建构公务员数据素养框架。

为了将公务员数据素养概念模型变成更具操作性和应用性的测量工具,采用实证研究方法来开发相应的测量量表,以保障测量工具的科学性和有效性。为此,基于访谈资料收集的测量要素,结合既有文献设计公务员数据素养调查问卷,并在G省公务员中进行实证调查。本研究借助Stata 16.0软件对量表进行信度和效度分析,验证测量量表设计的可靠信度、效度和拟合度。

2.2 资料收集

质性研究资料的收集按照研究目的和调查可行性进行取样收集数据、分析与编码,直到理论饱和为止。为了体现调查对象的代表性,选取省级、市级和县级政府中的公务员为研究对象,涵盖地方政府的各个层级,其工作岗位涉及综合管理类、行政执法类、专业技术类等。访谈均由笔者开展,应用了焦点团队访谈和个别深度访谈两种访谈方式,采用结构化和半结构化相结合的询问方式。访谈时间为2021年9月—2022年1月,访谈了G省37名公务员,每次访谈的时长为0.5~1.5小时,累计收集37份一手访谈资料,形成20余万字的访谈文本记录。随机选取其中30份访谈资料进行扎根理论编码分析,另外7份资料留作理论饱和度检验。

在定量研究资料的收集上,主要采用调查问卷的询问形式。通过设计公务员数据素养的测量量表初稿,发放、收集调查问卷并进行数据分析,以对所构建的公务员数据素养结构模型和量表进行实证验证。调查对象与质性研究资料范围保持一致,均为G省的省级、市级和县级公务员。采用方便抽样和判断抽样方式在G省发放调查问卷,累计回收884份问卷,剔除无法识别、缺失项过多和明显缺乏效度的问卷57份,得到有效问卷827份,有效问卷回收率为93.5%。

3.1 开放式编码

基于扎根理论,秉持开放性的理论建构原则,立足大量一手访谈文本,进行开放式编码。在此过程中,以两位研究人员独立编码的方式进行平行编码,最大程度地提升编码的客观中立性。经过逐行、逐句、逐段编码,得到104个初始概念,在其基础上提炼出25个上位范畴。由于篇幅有限,表1展示了部分范畴的初始概念及其对应的原始语句。

表1 开放式编码及其结果示例(部分)

3.2 选择性编码

依据初始概念出现的频率和概念关系,对开放式编码得到的25个范畴进一步归纳、整合和提炼,建构了公务员数据素养概念的7个主范畴,即数据意识、数据知识、数据学习能力、数据获取能力、数据分析能力、数据信息提取能力、数据应用能力。限于篇幅,此处展示了数据意识和数据应用能力两个主范畴的选择性编码(见表2)。

表2 数据意识和数据应用能力选择性编码展示

3.3 理论编码

在7个主范畴与公务员数据素养概念的关系上,通过重新整理质性材料,总结和分析前两步编码的结果和依据,发现所得范畴与数据素养概念相关,故将研究的核心范畴确定为公务员数据素养。

工程从规划、设计、施工到决算的每一步,虽都有专门部门进行材料成本管理,但部门间的横向联系、相互衔接工作做的还不够,未能达到密切配合、相互监督的高度.虽都已认识到成本管理是全员控制和全过程控制的工作,但在具体的工作实践中,还是存在各部门间因横向联系不畅或信息传递不及时,达不到精细化管理要求的情况.

在主范畴间的逻辑关系上,7个主范畴在公务员数据素养概念中有着不同的素养指向和理论功能。参考McClelland[24]的冰山模型,人的技能、行为等胜任特征浮于冰面之上,而知识、意识、动机等素质隐匿于冰面之下,越往下的因素越稳固和关键,也越难以甄别和测量。因此,依据公务员从事数据治理活动中所需能力素质的可观察程度,将数据意识、数据知识两个主范畴选择性编码概括为潜在数据素养;
而将数据学习能力、数据获取能力、数据分析能力、数据信息提取能力、数据应用能力这5个主范畴选择性编码概括为数据应用素养。

至此,一个多层次、多要素的公务员数据素养概念体系得以形成。从概念来看,公务员数据素养是公务员群体胜任数据全过程活动所需能力素质的综合,在内容上包含一系列结构化的能力素质因素。它在一级维度上由潜在数据素养和数据应用素养组成,包括数据意识、数据知识、数据学习能力、数据获取能力、数据分析能力、数据信息提取能力、数据应用能力等二级维度。

3.4 理论饱和度检验

由于原始材料体量较大、人力有限等因素,扎根理论过程中不免存在资料遗漏、误判等造成的理论非饱和,因此利用预留原材料进行理论饱和度检验,审查是否有被排除在外的概念和范畴。本研究通过对预留的7份访谈记录资料进行第二轮开放式编码、轴心式编码和选择性编码后,并未产生超越编码范围的新概念和范畴,第二轮编码的结果与第一轮编码所构建的理论框架高度吻合,由此判断研究的核心范畴已相对饱和。

4.1 量表开发

基于扎根理论研究,公务员数据素养的理论概念与结构得以从经验层面上建立,但与一个可操作、可测量的公务员数据素养评价指标体系还存在差距。为了开发公务员数据素养测量工具,基于扎根理论建构的概念模型采用定量研究方法进行测量量表开发与实证检验。

公务员数据素养量表初设的主要思路有两方面。一是在量表的因子结构上,立足前述质性扎根理论研究成果提供的7个主范畴理论结构。二是在每个因子的具体测量指标的初设上,一方面基于每个因子之下的副范畴结构以及高频扎根编码词组进行初设;
另一方面回应相关数据素养测量量表,如潜在数据素养层的因子测量参考Stephenson等[25]、Carlson等[26]的概念模型及其测量指标,数据应用素养层的因子测量指标参考Mandinach等[7]、Prado等[10]、Qin等[13]、Breiter等[14]设计的量表题目。由此,形成公务员数据素养测量量表雏形,其由7个理论因子和21项具体测量指标组成。

4.2 调查样本特征

为检验公务员数据素养初设测量量表的信效度,本研究采用问卷调查形式进行实证检验。设计调查问卷,面向G省各级政府及下辖单位的公务员进行调查,在研究的有效样本中(N=827),从性别上看,男性和女性分别为430人和397人;
从年龄分布情况看,25岁及以下占比17.5%,26~35岁占比58.2%,36~45岁占比16.8%,46~55岁占比6.5%,56岁及以上占1.0%;
从文化程度来看,中专/高中及以下、大专、本科、硕士、博士样本占比分别为5.8%、21.2%、67.0%、5.8%、0.2%;
样本基本涵盖了公务员职能属性,其中经济发展占比25.1%、执法监管占比8.0%、公共服务占比47.4%、社会管理占比5.2%、党政综合管理占比14.3%。总体来看,样本的人口统计学特征接近该群体的自然分布,调查样本体现了公务员群体的代表性。

将问卷调查收集的被测数据录入Stata 16.0软件,采用Cronbach’s α信度系数对公务员数据素养测量量表的整体信度进行检验。结果显示,量表总体的α系数为0.93(大于0.90),说明公务员数据素养测量指标和问题的一致性较高,量表总体信度通过;
同时,公务员数据素养7个理论维度的α系数均大于0.90,说明各理论因子内部的测量指标也具有很高的一致性,稳定性较好。

4.3 因子分析

利用因子分析检验公务员数据素养量表的效度。首先利用探索性因子分析检验公务员数据素养初设量表的因子构成是否成立,即检验量表中各维度测量指标问题与对应理论概念是否相符,然后用验证性因子分析来验证探索性因子分析因子结构模型。为此,将调查样本一分为二,用一半样本进行探索性因子分析(N=414),另一半样本进行验证性因子分析(N=413)。

探索性因子分析结果显示,KMO系数为0.947,Bartlett球形检验近似卡方值为16 879.007,自由度为210,显著性概率p为0(小于0.05),这些参数说明量表非常适合因子分析。采用主成分分析方法(PCA)和方差最大正交旋转(Varimax),只保留公因子方差和因子载荷高于0.5的部分,得到6个公务员数据素养因子。用于测量数据信息提取能力的3个题目交叉载荷超过0.4,予以剔除,剩余18个测量题目分别归属于6个成分因子,因子载荷介于0.635~0.933,累计方差贡献率为0.833(大于0.600)。需要说明的是,数据信息提取能力没有成为一个独立因子:一方面,这是保障因子条目载荷清晰性的技术要求;
另一方面,由于信息提取过程与数据分析能力维度的要求、目标和特征等具有一致性,本质都是加工数据解析价值信息,这是贯穿整个数据管理利用过程的必要能力[27],也意味着数据分析能力可以一定程度反映信息提取能力。为此,删除数据信息提取能力这一维度及其测量条目,纠正了扎根理论的概念建构偏误。

为了检验经由探索性因子分析发现的公务员数据素养因子数量和结构,采用验证性因子分析来进一步确认其因子结构和效度。使用另一半数据样本的测量数据进行验证性因子分析,将公务员数据素养18个测量指标分别归属于6个因子,并对结构模型进行拟合度检验。结果显示,结构模型的主要拟合指标均通过了检验。反应模型与数据之间拟合优度的绝对指标RMSEA为0.05,低于推荐阈值0.08,结果可以接受。其他关键拟合指标CFI=0.979(大于0.900)、TLI=0.973(大于0.900),以及SRMR(0.028)、GFI(0.971)、NFI(0.971)等均满足统计学的基本要求。经过验证的公务员数据素养结构模型如图1所示,测量指标在每个因子上的载荷显著且清晰,与探索性因子分析的因子结构相吻合,模型拟合效果较好。

图1 公务员数据素养结构模型

最后,对公务员数据素养测量量表进行附加的信度和效度检验,主要进行了组合信度(CR)和平均方差抽取值(AVE)计算(见表3)。结果表明:公务员数据素养各个因子的组合信度均高于0.700,说明量表的6个维度结构具有理想的建构信度;
平均方差抽取值均高于0.600,说明各因子内的测量指标提取度优秀,可以认为潜变量的解释变异量大于测量误差的解释变异量,量表具有较好的聚合效度。此外,各因素平均方差抽取值的平方根均大于与其他因子的相关系数,这表明量表在整体上具有良好的区分效度。总体而言,可以证实研究所设计的公务员数据素养测量量表具有较好的测量质量。

表3 潜在变量的组合信度(CR)、平均方差抽取值(AVE)及变量相关系数

在政府治理数字化、数据化和智能化全面转型的背景下,数据驱动的公共管理与决策成为政府治理新范式,数据素养已然成为公务员必备的能力素质。基于质性和量化相结合的混合研究设计,发现公务员数据素养概念具有复合性,是公务员群体胜任数据活动全过程所需能力素质的综合。在素养结构上,公务员数据素养包含潜在数据素养和数据应用素养两个层面,具体则由数据意识、数据知识、数据学习能力、数据获取能力、数据分析能力、数据应用能力等具体素养因子构成。相对既有研究,潜在的研究增量贡献表现在三方面:在研究议题上,论文首次直接提出公务员数据素养议题,丰富了政府数据治理的议题空间;
在研究方法上,采取了融合质性与量化研究各自优点的混合研究路径,开发出更具解释力的公务员数据素养量表,为该议题及邻近议题提供科学的测量工具;
在研究结论上具有一定创新性,既有数据素养框架及其测量多注重显性的数据应用技能,概念建构狭窄,测量指标简单,忽视了公务员数据素养概念的复杂性和丰富性,尤其是忽略了影响数据应用能力的潜在性、前置性和基础性数据素养。本研究立足公务员的一手数据和经验反馈,建构出的“潜在素质+显性技能”数据素养结构体系更合理,这为理论与实践领域提供了更加全面的理论研究视角和测量工具。

作为一项对公务员数据素养的探索性研究,本研究在样本选取、理论建构、问题解释等方面尚存在不足。在研究样本上,本研究收集的样本主要来自西南地区G省的公务员群体,但我国幅员辽阔,不同地区政府数据治理水平和政府数字化转型程度不一,公务员素质与特征存在差异,研究结论是否在更大范围具有适用性有待商榷。为此,未来面向不同地区公务员的实证研究可以给本文的研究结论提供交叉检验的机会。在理论建构上,本文构建的公务员数据素养概念模型具有通用性和一般性特点,这有可能忽略不同部门、不同岗位、不同职责、不同场景下公务员的特殊数据活动以及能力素质需求。为此,未来研究可以在公务员数据素养概念模型建构上加入特殊性和场景性因素,构建面向公务员细分群体的理论模型。限于研究定位和人力成本,本文并没有探讨公务员数据素养的实际水平和解释性研究,而这是构建公务员数据素养测量工具的意义与目的所在。未来研究可以利用本文开发的公务员数据素养测量量表对不同地区的公务员进行实际调查,了解其数据素养水平和存在问题,并展开创新性和针对性影响因素研究。公务员数据素养是政府数据治理、数字政府、公务员能力等领域的交叉性新兴议题,还有待学术和实践领域的持续关注和完善。

猜你喜欢公务员编码量表基于SAR-SIFT和快速稀疏编码的合成孔径雷达图像配准四川轻化工大学学报(自然科学版)(2021年1期)2021-06-09《全元诗》未编码疑难字考辨十五则汉字汉语研究(2020年2期)2020-08-13子带编码在图像压缩编码中的应用电子制作(2019年22期)2020-01-14胸痹气虚证疗效评价量表探讨中国中医急症(2019年10期)2019-05-21Genome and healthcare疯狂英语·新读写(2018年3期)2018-11-29篮球公务员NBA特刊(2018年14期)2018-08-13三种抑郁量表应用于精神分裂症后抑郁的分析中国卫生标准管理(2015年1期)2016-01-15慢性葡萄膜炎患者生存质量量表的验证中国中医眼科杂志(2015年1期)2015-12-28初中生积极心理品质量表的编制心理学探新(2015年4期)2015-12-10

Tags: 素养   测量   公务员  

搜索
网站分类
标签列表