当前模板已根据「数据治理工程师」岗位深度优化
选择其他岗位
开始编辑模板后,您可以进一步自定义包括:工作履历、工作内容、信息模块、颜色配置等
内置经深度优化的履历,将为你撰写个人简历带来更多灵感。
陆明哲的照片
28岁
3年工作经验
13800138000
DB@zjengine.com
求职意向
数据治理工程师
东莞
薪资面谈
三个月内到岗
技能特长
沟通能力
执行能力
热情坦诚
文案能力
兴趣爱好
摄影
看书
阅读
跑步
陆明哲
在平凡的岗位上创造不平凡的价值,这是我的职业信仰。
工作经历
2022.07 - 2024.03
小楷数智
高级数据治理工程师

负责电商平台全链路数据资产治理,主导数据质量、元数据、分类分级三大核心模块建设,协同业务、技术、安全团队推动治理策略落地,支撑数据中台对外赋能与合规要求。

  • 主导设计电商业务线数据质量闭环体系,基于Soda Core规则引擎与自研校验框架,针对用户行为、交易订单、商品库存3类核心数据,定制120+动态质量规则(含唯一性、完整性、一致性),通过Airflow调度实现小时级监控;针对大促期间数据波动问题,开发异常检测模型(基于孤立森林算法),将质量问题发现时效从T+1缩短至15分钟,大促期间数据质量事故率下降82%。
  • 牵头元数据管理平台升级,整合Apache Atlas与自研标签系统,完成2000+数据源(含MySQL、Hive、ClickHouse)的全量元数据采集,设计‘技术元数据+业务元数据+管理元数据’三维标签体系;针对跨部门元数据理解不一致问题,推动制定《电商元数据命名规范V2.0》,明确23类核心实体的属性定义标准,元数据准确率从78%提升至97%,业务团队自助查询效率提升65%。
  • 推动数据分类分级落地,依据DCMM(数据管理能力成熟度评估模型)与《个人信息保护法》要求,主导编制电商行业数据分类目录(含用户隐私、交易敏感、运营分析3级12类),设计‘自动打标+人工复核’双轨机制;针对用户手机号、支付信息等敏感数据,联动安全团队实现脱敏规则与访问权限的动态绑定,全年未发生因分级不清导致的合规风险事件。
  • 搭建治理效果评估体系,从质量(达标率)、效率(问题定位时长)、成本(冗余数据存储量)3个维度设计18项指标,通过Grafana可视化看板实时监控;推动将治理成效纳入业务部门KPI,促成跨部门治理协作会议机制,全年推动解决跨域数据冲突问题47项,数据共享效率提升50%。
2020.06 - 2022.06
小楷互联
数据治理工程师

聚焦本地生活服务数据资产盘点与治理,负责餐饮、到店、酒旅3条业务线的数据质量监控规则制定、元数据梳理及分类分级试点,支撑业务决策分析与数据产品输出。

  • 核心参与公司首套数据治理体系搭建,主导完成餐饮业务线全量数据资产盘点,通过SQL脚本与元数据工具结合,梳理出12个业务域、45张核心表、2000+字段的业务含义与应用场景,输出《餐饮数据资产目录V1.0》,资产覆盖率从65%提升至88%,业务团队数据查找耗时减少40%。
  • 设计餐饮订单数据质量监控方案,针对‘订单状态不一致’‘优惠金额超限’等高频问题,基于Sqoop增量同步日志与自定义规则,开发质量校验脚本(Python+PySpark),实现每日凌晨自动跑批检测;上线后订单数据问题闭环率从55%提升至82%,下游报表数据修正工作量减少60%。
  • 试点数据分类分级,参考《金融数据安全分级指南》并结合本地生活场景,将用户地址、支付凭证定义为‘高敏感’,商家资质、评价内容定义为‘中敏感’,制定分级存储策略(高敏感数据加密存于HBase,中敏感存于ClickHouse);推动技术团队完成存储架构调整,敏感数据泄露风险降低75%。
  • 协同数据产品团队优化数据服务接口,针对‘用户消费频次’等高频调用指标,通过治理后的高质量数据源重构计算逻辑,接口响应时间从800ms降至200ms,支撑前端‘猜你喜欢’推荐功能点击率提升18%。
2018.07 - 2020.05
小楷科技
数据治理专员

协助完成金融风控数据的基础治理工作,包括元数据采集、数据质量规则初步设计及分类分级文档整理,为后续治理体系落地奠定基础。

  • 负责金融风控核心库(含用户征信、设备指纹、交易流水)的元数据补全,通过编写Shell脚本调用Apache Atlas API,批量采集200+表的字段类型、更新频率等信息,修正错误元数据130余条,元数据完整率从81%提升至95%,支撑开发团队快速定位数据来源。
  • 参与设计基础数据质量规则,针对‘身份证号格式错误’‘手机号重复’等问题,基于正则表达式与Hive UDF,开发15条轻量级校验规则,嵌入ETL流程;上线后原始数据错误率从12%降至3%,减少下游风控模型训练的脏数据处理时间。
  • 协助整理金融数据分类分级初稿,梳理用户身份信息、账户交易记录等8类数据的敏感等级,参考《个人金融信息保护技术规范》标注保护要求;输出《金融数据分类建议清单》,为后续正式分级提供参考依据。
  • 优化数据问题反馈流程,设计Excel模板收集业务部门数据质量问题,通过VLOOKUP匹配规则库快速定位根因,将问题处理周期从3天缩短至1天,季度问题解决满意度从70%提升至88%,获部门季度优秀新人奖。
项目经验
2022.03 - 2023.08
星途互动(北京)科技有限公司
大数据开发负责人

星途社区用户行为深度分析平台研发

  • 星途社区作为千万级MAU的UGC内容平台,原有用户行为分析系统存在三大痛点:实时性不足(离线T+1、实时链路延迟超5分钟)、多端(APP/小程序/Web)数据Schema不统一、无法支撑用户行为路径关联分析,导致运营决策滞后、推荐系统无法利用实时行为优化。我的核心职责是主导平台从0到1的架构设计与落地,对齐“实时洞察+深度归因”的业务目标,构建“实时+离线”一体化的用户行为分析能力。
  • 项目面临三重技术挑战:1)多源异构数据的实时同步与标准化——不同端的用户行为事件定义混乱(如APP的“点赞”与小程序的“喜欢”字段不一致),且原有Kafka消息格式无规范;2)实时计算的低延迟与高吞吐矛盾——原有Spark Streaming处理10万TPS数据时延迟超5分钟,无法满足实时运营的即时反馈需求;3)用户行为路径的深度挖掘——传统SQL无法高效处理“点击→收藏→分享→转化”的长链路关系,难以支撑运营找高价值路径。
  • 针对Schema混乱问题,我牵头梳理全端20+核心用户行为事件(如“视频完播”“商品点击”“评论互动”),制定标准化字段规范,通过Flink CDC同步业务库变更,结合Kafka Connect实现多端数据的清洗、转换与统一入湖;对于实时延迟,将计算引擎从Spark Streaming迁移至Flink,优化Checkpoint策略(启用增量检查点+调整间隔至30秒),将延迟压降至30秒内;针对路径分析,设计“用户-内容”双节点图模型,用Flink实时将行为事件写入Neo4j图数据库,支撑秒级查询用户转化路径。
  • 平台上线后,实时分析延迟从5分钟降至30秒,离线分析周期从T+1缩短至小时级,可支撑10万+TPS的用户行为数据处理。业务价值显著:运营团队基于实时路径分析优化活动策略,转化率提升25%;个性化推荐系统接入实时行为数据后,点击率提升18%,月均用户留存率提升8%。我个人主导了平台核心架构设计与多源数据整合,解决了实时性与深度分析的核心矛盾,成为团队在用户行为领域的关键技术负责人。
2020.07 - 2021.12
星途互动(北京)科技有限公司
大数据开发工程师

星途短视频内容分发大数据Pipeline重构

  • 随着公司短视频业务从100万DAU增长至500万DAU,原有内容分发数据Pipeline基于Storm构建,存在耦合度高(计算、存储、监控模块混杂)、扩展性差(新内容类型如直播切片接入需修改核心代码)、数据质量无保障(下游每周因字段缺失/错误报错2次)等问题,严重制约新业务上线速度。我的职责是负责Pipeline核心模块重构,提升系统可扩展性与数据可靠性,支撑直播、短剧等新业务快速落地。
  • 项目挑战集中在三点:1)Storm框架的维护成本高——复杂逻辑需编写Java代码,迭代周期长;2)元数据管理混乱——不同内容类型的标签、分发渠道字段无统一标准,导致调度逻辑复杂;3)数据质量失控——缺乏实时校验,下游应用频繁因脏数据故障。
  • 重构中,我将原有Pipeline拆解为“采集-清洗-转换-存储”四个通用组件:用Spark Structured Streaming替代Storm,利用其声明式API与端到端Exactly-Once语义,降低维护成本;引入Apache Atlas作为元数据管理系统,定义覆盖“内容ID、类型、标签、分发渠道”的统一模型,新内容类型只需配置元数据即可接入;搭建基于Flink的数据质量监控系统,实时校验10+核心规则(如“视频时长≥10秒”“标签非空”),异常数据拦截并报警,同时写入隔离区排查。
  • 重构后,Pipeline扩展性提升50%,新内容类型接入时间从1周缩短至1天,数据错误率从8%降至1%以下,下游故障率几乎清零。业务层面,支撑直播业务快速上线,直播内容分发效率提升40%,播放量占比从10%增长至30%。我个人完成了核心组件的解耦与元数据体系搭建,解决了原有系统的耦合性问题,为后续业务规模化扩展奠定了基础。
教育背景
2014.09 - 2017.06
XX实验高级中学
文科综合班
通过辩论社核心训练(市级最佳辩手),形成结构化表达与快速信息整合能力;发起“乡村中学读书角”公益项目,协调多方资源覆盖8所学校,验证项目0-1落地方法论。
2017.09 - 2021.06
XX师范大学
汉语言文学(本科)
深耕内容创作与传播理论(核心课程优秀率90%),建立用户心理洞察方法论;运营校级公众号期间,通过内容策略调整使粉丝量3个月增长200%(1.5万→4.5万),输出《高校新媒体爆款公式》被20+社团采用。获全国大学生新媒体运营大赛银奖。
奖项荣誉
  • 计算机技术与软件专业技术资格(水平)证书(信息系统管理工程师)
  • 2023年度公司数据治理项目攻坚奖
  • 2024年公司优秀技术员工
自我评价
  • 深耕互联网数据治理,擅长从业务目标倒推治理优先级,用“问题-机制-追踪”闭环破解数据资产化碎片化难题。
  • 通晓行业数据合规与业务增长的平衡逻辑,主导过适配多业务线的元数据体系搭建,更会用“业务语言”让技术规则落地。
  • 是主动预判风险的治理者,能从数据异常里嗅出隐患,习惯联动产品/研发提前埋点,拒绝事后救火。
  • 以“让数据成为业务可信资产”为锚点,过往通过优化流程推动跨部门数据协作效率显著提升。
试一下,换个颜色
选择配色
使用此模板创建简历
  • 支持电脑端、微信小程序编辑简历
  • 支持一键更换模板,自由调整字距行距
  • 支持微信分享简历给好友查看
  • 支持简历封面、自荐信、自定义简历模块
  • 支持导出为PDF、图片、在线打印、云端保存
该简历模板已内置
  • 个人名称
  • 头像
  • 基本信息
  • 求职意向
  • 工作经历
  • 项目经验
  • 实习经验
  • 作品展示
  • 奖项荣誉
  • 校园经历
  • 教育背景
  • 兴趣爱好
  • 技能特长
  • 语言能力
  • 自我评价
  • 报考信息
  • 简历封面
  • 自荐信
对话框
提示
说明