负责市级政务数据平台的归集、治理、分析及应用支撑,统筹跨部门数据共享机制落地,推动数据质量提升与服务效能优化,保障政务数据全生命周期合规性与可用性。
- 主导设计市级政务数据资源目录2.0版,基于《政务信息资源目录编制指南》梳理32个部门12类核心数据元标准(如自然人身份标识、法人统一社会信用代码),通过Informatica PowerCenter ETL工具完成800万+条历史数据清洗转换,解决跨系统数据字段不一致(如“出生日期”存在YYYY-MM-DD与YYYY/MM/DD两种格式)、编码冲突问题,数据共享率从65%提升至89%,支撑“出生一件事”联办事项提速60%。
- 核心参与构建数据质量全流程管控体系,参照DAMA数据管理知识体系设计包含完整性(字段缺失率)、准确性(逻辑矛盾率)、一致性(跨库匹配率)的12项评估指标,开发Python自动化校验脚本(集成Pandas数据清洗库),每月识别并修复问题数据1.2万条,季度数据质量达标率从78%提升至94%,获市大数据局“数据治理优秀案例”通报表扬。
- 重点优化政务数据共享交换流程,针对教育入学、社保转移等高频共享场景,搭建基于联邦学习的数据沙箱环境,采用SM4国密算法对身份证号、银行卡号等敏感字段进行不可逆脱敏,同步制定《数据共享最小必要原则实施细则》,支撑11个部门开展联合审批,平均办理时限从15个工作日缩短至9个工作日,群众投诉率下降42%。
- 牵头完成政务服务事项与数据资源关联分析,运用Apriori关联规则挖掘算法识别出23项“数据断点”事项(如“二手房过户”需重复提交婚姻登记证明),推动民政、不动产登记中心补充缺失数据字段,事项材料精简率达28%,线上申报通过率从61%提升至96%,入选省级“政务服务数据赋能”典型案例。