数据中心;
数据管理;
数据溯源
为贯彻落实整合共享要求,江苏药监局信息中心规划建设统一集成平台和数据中心项目,项目目标主要包括一是数据的整合应用,整合各业务条线独立分散的业务系统数据,通过清洗、关联、转换到数据仓库,面向上层业务系统和业务人员提供数据应用,实现数据的互联互通;
二是数据中心管理能力建设,完整数据管理流程,实现数据的全生命周期管理,主要面向信息中心管理人员和项目运维人员。本文主要讨论电子政务数据中心管理能力建设。
为贯彻落实政务资源共享交换要求,各单位面临着横向各部门、纵向各业务条线数据共享交换要求,针对企业许可证信息、产品信息等重点核心数据项,对数据的全面性、及时性、完整性、数据质量提出具体要求,比如数据报送覆盖率、数据报送成功率、数据入库率。为满足上述共享交换要求,结合局业务数据现状,探索建立一套归集、清洗、比对、校验、入库、共享使用、错误反馈等一整套数据闭环管理流程。数据管理能力建设主要包括如下几个方面:2.1数据交换管理能力建设。数据交换管理能力建设主要包括一是明确数据采集条数,由于数据采集对象数据更新方式有增量更新和全量更新不同,还需要明确数据增量更新条数,增量更新包括新增数据和修改数据;
二是要明确数据对外报送条数和报送成功条数。原则上保障:一是通过提高数据质量,进一步提高数据入库率,二是增量更新的数据条数,数据入库后实现对外报送成功率100%。2.2数据处理过程流程化和图形化。明确数据处理流程化。明确数据从贴源层开始,先后通过数据规范标准清洗、外部数据比对补充(比如企业统一社会信用代码)、校验规则校验等关键步骤后数据入库。其中根据数据标准规范电子化清洗解决规范性文档不能实际落地应用难题,;
校验规则可通过图形化的界面进行配置校验,规则本身可通过配置进行增加或者修改,实现数据清洗过程全程流程化和图形化。通过展示数据的全流程处理过程,直观地了解数据的采集、清洗、入库等数据变化过程,实现数据的溯源。2.3建立数据入库错误反馈机制。通过技术手段建立错误数据反馈给业务系统和文档上传人,切实加强错误数据修改后上传;
定期向业务处室或者数据报送牵头处室输出数据归集情况、报送情况和数据质量情况,其中数据质量考核规则可通过配置增加修改,比如数据完整性、数据的有效性、数据及时性,数据质量报告以图形化报告文档体现,有效强化业务人员数据管理意识,督促业务系统加强数据质量管理。另外探索通过将数据校验过程前移到业务系统层从源头提高数据质量,一是针对数据中心已建各业务系统都通用的数据组件,封装成数据接口直接供业务系统调用,比如统一社会信用代码库,二是针对校验规则封装为应用接口直接嵌入到业务系统。2.4明确落实数据责任。从技术的角度落实数据责任,一是明确数据提供方,数据归集时应记录数据源头,无论是业务系统、表格上传等归集方式都明确到具体系统或者上传人员,二是记录项目中间处理过程全流程,三是建立的错误数据反馈制度,督促错误数据必须由数据提供方修改正确后重新进入数据采集入库流程,切实实现数据的全流程管理可以明确到具体责任人。2.5数据共享使用审核流程化。明确数据的对外共享使用采用审核制度,首先由数据使用方提供数据应用场景和数据项,其次数据使用方提交需求给数据提供方比如业务处室审核,审核通过后由数据中心提供数据接口或者下载数据。数据中心管理数据接口申请和下载次数,了解数据应用需求。2.6项目运维流程规范化明确运维人员每月、每周或者每天运维内容,比如硬件方面确保数据交换平台、消息中间件、数据中心服务器状态正常;
软件方面需要查看数据归集交换任务执行情况,定期梳理数据交换情况和数据质量情况,重点关注核心数据的数据质量等;
定期输出运维报告。
作为数据中心建设的一部分内容,数据管理能力建设应同步数据中心数据建设,建立一套的数据管理流程,规范数据的全周期管理,有助于梳理数据现状,了解数据的全流程变化,提高数据质量。随着业务系统数据、共享交换归集第三方数据积累,数据管理能力体现日益凸显。
[1]国务院办公厅关于印发政务信息系统整合共享实施通知.
【电子政务数据中心管理能力建设研究】相关文章: