当前模板已根据「数据治理工程师」岗位深度优化
选择其他岗位
开始编辑模板后,您可以进一步自定义包括:工作履历、工作内容、信息模块、颜色配置等
内置经深度优化的履历,将为你撰写个人简历带来更多灵感。
陆明哲的照片
28岁
3年工作经验
13800138000
DB@zjengine.com
求职意向
数据治理工程师
东莞
薪资面谈
一个月内到岗
技能特长
沟通能力
执行能力
热情坦诚
文案能力
兴趣爱好
摄影
看书
阅读
跑步
陆明哲
用系统化的思维解决问题,用温度化的方式交付成果,这是我的工作准则。
工作经历
2024.03 - 至今
小楷科技有限公司
数据治理平台架构师
  • 作为技术负责人,从0到1主导设计并实现了公司「一体化智能数据治理平台」。该平台深度融合元数据管理、数据质量、数据安全、数据血缘四大核心能力,提供从数据发现、评估、使用到运营的全生命周期管理,成为公司200+数据开发者和分析师日常工作的统一入口,数据需求响应效率提升300%。
  • 设计主动式元数据管理体系,通过解析10万+离线/实时作业、2万+张数据表,自动构建了覆盖“数据产生->加工->服务->消费”的端到端血缘图谱,并将血缘准确性从60%提升至98%,实现了影响分析的分钟级响应。
  • 攻克智能数据质量核查难题,基于历史数据和机器学习算法,自动为不同特征的数据智能推荐监控规则(如值域、波动率、唯一性),并实现动态阈值调整,将数据质量问题的发现时间从“天”缩短至“小时”,问题发现率提升85%。
  • 建立“数据资产健康度”综合评估模型,从“质量、热度、价值、成本”四个维度对数据资产进行量化评分与排名,并推动业务部门对低效数据进行治理或归档,年节省存储与计算成本超千万元。
2023.02 - 2024.03
小楷科技有限公司
高级数据治理工程师
  • 负责公司“数据标准”体系的落地,主导定义了“用户、商品、交易”等核心域的500+项标准,并通过开发平台工具,将标准固化到数据建模与开发流程中,从源头保障数据的一致性,数据标准覆盖率从20%提升至90%。
  • 实现“数据地图”核心搜索与推荐功能,支持基于数据标签、血缘、热度进行智能检索,数据资产可发现性提升200%,成为数据消费的首要入口。
  • 深入业务,推动“数据Owner”制度的建立与落地,明确了每一份数据的责任方,彻底解决了数据问题无人负责的困境。
项目经验
2022.03 - 2023.08
星途互动(北京)科技有限公司
大数据开发负责人

星途社区用户行为深度分析平台研发

  • 星途社区作为千万级MAU的UGC内容平台,原有用户行为分析系统存在三大痛点:实时性不足(离线T+1、实时链路延迟超5分钟)、多端(APP/小程序/Web)数据Schema不统一、无法支撑用户行为路径关联分析,导致运营决策滞后、推荐系统无法利用实时行为优化。我的核心职责是主导平台从0到1的架构设计与落地,对齐“实时洞察+深度归因”的业务目标,构建“实时+离线”一体化的用户行为分析能力。
  • 项目面临三重技术挑战:1)多源异构数据的实时同步与标准化——不同端的用户行为事件定义混乱(如APP的“点赞”与小程序的“喜欢”字段不一致),且原有Kafka消息格式无规范;2)实时计算的低延迟与高吞吐矛盾——原有Spark Streaming处理10万TPS数据时延迟超5分钟,无法满足实时运营的即时反馈需求;3)用户行为路径的深度挖掘——传统SQL无法高效处理“点击→收藏→分享→转化”的长链路关系,难以支撑运营找高价值路径。
  • 针对Schema混乱问题,我牵头梳理全端20+核心用户行为事件(如“视频完播”“商品点击”“评论互动”),制定标准化字段规范,通过Flink CDC同步业务库变更,结合Kafka Connect实现多端数据的清洗、转换与统一入湖;对于实时延迟,将计算引擎从Spark Streaming迁移至Flink,优化Checkpoint策略(启用增量检查点+调整间隔至30秒),将延迟压降至30秒内;针对路径分析,设计“用户-内容”双节点图模型,用Flink实时将行为事件写入Neo4j图数据库,支撑秒级查询用户转化路径。
  • 平台上线后,实时分析延迟从5分钟降至30秒,离线分析周期从T+1缩短至小时级,可支撑10万+TPS的用户行为数据处理。业务价值显著:运营团队基于实时路径分析优化活动策略,转化率提升25%;个性化推荐系统接入实时行为数据后,点击率提升18%,月均用户留存率提升8%。我个人主导了平台核心架构设计与多源数据整合,解决了实时性与深度分析的核心矛盾,成为团队在用户行为领域的关键技术负责人。
2020.07 - 2021.12
星途互动(北京)科技有限公司
大数据开发工程师

星途短视频内容分发大数据Pipeline重构

  • 随着公司短视频业务从100万DAU增长至500万DAU,原有内容分发数据Pipeline基于Storm构建,存在耦合度高(计算、存储、监控模块混杂)、扩展性差(新内容类型如直播切片接入需修改核心代码)、数据质量无保障(下游每周因字段缺失/错误报错2次)等问题,严重制约新业务上线速度。我的职责是负责Pipeline核心模块重构,提升系统可扩展性与数据可靠性,支撑直播、短剧等新业务快速落地。
  • 项目挑战集中在三点:1)Storm框架的维护成本高——复杂逻辑需编写Java代码,迭代周期长;2)元数据管理混乱——不同内容类型的标签、分发渠道字段无统一标准,导致调度逻辑复杂;3)数据质量失控——缺乏实时校验,下游应用频繁因脏数据故障。
  • 重构中,我将原有Pipeline拆解为“采集-清洗-转换-存储”四个通用组件:用Spark Structured Streaming替代Storm,利用其声明式API与端到端Exactly-Once语义,降低维护成本;引入Apache Atlas作为元数据管理系统,定义覆盖“内容ID、类型、标签、分发渠道”的统一模型,新内容类型只需配置元数据即可接入;搭建基于Flink的数据质量监控系统,实时校验10+核心规则(如“视频时长≥10秒”“标签非空”),异常数据拦截并报警,同时写入隔离区排查。
  • 重构后,Pipeline扩展性提升50%,新内容类型接入时间从1周缩短至1天,数据错误率从8%降至1%以下,下游故障率几乎清零。业务层面,支撑直播业务快速上线,直播内容分发效率提升40%,播放量占比从10%增长至30%。我个人完成了核心组件的解耦与元数据体系搭建,解决了原有系统的耦合性问题,为后续业务规模化扩展奠定了基础。
教育背景
2014.09 - 2017.06
XX实验高级中学
文科综合班
通过辩论社核心训练(市级最佳辩手),形成结构化表达与快速信息整合能力;发起“乡村中学读书角”公益项目,协调多方资源覆盖8所学校,验证项目0-1落地方法论。
2017.09 - 2021.06
XX师范大学
汉语言文学(本科)
深耕内容创作与传播理论(核心课程优秀率90%),建立用户心理洞察方法论;运营校级公众号期间,通过内容策略调整使粉丝量3个月增长200%(1.5万→4.5万),输出《高校新媒体爆款公式》被20+社团采用。获全国大学生新媒体运营大赛银奖。
奖项荣誉
  • CDGA数据治理工程师认证
  • 2023年度公司数据治理项目攻坚奖
  • 2022年公司优秀员工
自我评价
  • 深耕互联网数据治理5年,锚定“让数据成为可信业务资产”核心,擅长从业务痛点反推治理策略,拒绝工具盲目堆叠。
  • 习惯用“业务语言+技术逻辑”双视角沟通,曾推动多部门对齐数据标准,关键是将抽象要求转化为可执行动作降阻力。
  • 搭建“预防-监控-迭代”闭环框架,不满足单点解决,更关注机制化避免问题复发,推动治理从“救火”转“长效”。
  • 吃透互联网“快迭代与数据质量”核心矛盾,在合规底线设计轻量适配方案,既保安全又不拖业务节奏。
试一下,换个颜色
选择配色
使用此模板创建简历
  • 支持电脑端、微信小程序编辑简历
  • 支持一键更换模板,自由调整字距行距
  • 支持微信分享简历给好友查看
  • 支持简历封面、自荐信、自定义简历模块
  • 支持导出为PDF、图片、在线打印、云端保存
该简历模板已内置
  • 个人名称
  • 头像
  • 基本信息
  • 求职意向
  • 工作经历
  • 项目经验
  • 实习经验
  • 作品展示
  • 奖项荣誉
  • 校园经历
  • 教育背景
  • 兴趣爱好
  • 技能特长
  • 语言能力
  • 自我评价
  • 报考信息
  • 简历封面
  • 自荐信
对话框
提示
说明