负责电商平台全链路数据资产治理,主导数据质量、元数据、分类分级三大核心模块建设,协同业务、技术、安全团队推动治理策略落地,支撑数据中台对外赋能与合规要求。
- 主导设计电商业务线数据质量闭环体系,基于Soda Core规则引擎与自研校验框架,针对用户行为、交易订单、商品库存3类核心数据,定制120+动态质量规则(含唯一性、完整性、一致性),通过Airflow调度实现小时级监控;针对大促期间数据波动问题,开发异常检测模型(基于孤立森林算法),将质量问题发现时效从T+1缩短至15分钟,大促期间数据质量事故率下降82%。
- 牵头元数据管理平台升级,整合Apache Atlas与自研标签系统,完成2000+数据源(含MySQL、Hive、ClickHouse)的全量元数据采集,设计‘技术元数据+业务元数据+管理元数据’三维标签体系;针对跨部门元数据理解不一致问题,推动制定《电商元数据命名规范V2.0》,明确23类核心实体的属性定义标准,元数据准确率从78%提升至97%,业务团队自助查询效率提升65%。
- 推动数据分类分级落地,依据DCMM(数据管理能力成熟度评估模型)与《个人信息保护法》要求,主导编制电商行业数据分类目录(含用户隐私、交易敏感、运营分析3级12类),设计‘自动打标+人工复核’双轨机制;针对用户手机号、支付信息等敏感数据,联动安全团队实现脱敏规则与访问权限的动态绑定,全年未发生因分级不清导致的合规风险事件。
- 搭建治理效果评估体系,从质量(达标率)、效率(问题定位时长)、成本(冗余数据存储量)3个维度设计18项指标,通过Grafana可视化看板实时监控;推动将治理成效纳入业务部门KPI,促成跨部门治理协作会议机制,全年推动解决跨域数据冲突问题47项,数据共享效率提升50%。