当前模板已根据「数据平台开发工程师」岗位深度优化
选择其他岗位
开始编辑模板后,您可以进一步自定义包括:工作履历、工作内容、信息模块、颜色配置等
内置经深度优化的履历,将为你撰写个人简历带来更多灵感。
陆明哲
在平凡的岗位上创造不平凡的价值,这是我的职业信仰。
28岁
3年工作经验
13800138000
DB@zjengine.com
陆明哲的照片
求职意向
数据平台开发工程师
苏州
薪资面谈
三个月内到岗
工作经历
2023.07 - 2025.06
小楷电商科技
数据平台开发工程师

负责公司大数据基础平台核心模块(元数据管理、实时计算链路、资源调度)的架构设计与迭代,聚焦平台稳定性、性能优化及对电商营销、用户运营等上层业务的支撑能力提升

  • 主导设计并落地基于Apache Doris的统一元数据管理系统,针对原有元数据分散在Hive、ClickHouse、Kafka的痛点,采用Apache Atlas对接各数据源,结合自研Java+Canal元数据同步工具,实现跨源元数据实时采集与一致性校验;通过Atlas图数据库模型优化元数据关联查询逻辑,将元数据检索耗时从平均12s降至2s内,支撑数据治理团队对10万+张表的快速定位与血缘分析,元数据管理效率提升80%
  • 核心参与双11大促实时计算链路扩容,针对实时订单流处理延迟从500ms攀升至2s的问题,定位到Flink作业并行度不足与RocksDB状态后端性能瓶颈;采用Flink Adaptive Scheduler动态调整并行度,替换为Apache Pravega高吞吐状态存储,同步调整batch size至5000减少IO开销;最终大促期间实时订单处理延迟稳定在300ms内,支撑营销活动实时用户行为分析与优惠券精准推送,活动转化率提升18%
  • 负责YARN集群资源调度模块优化,针对资源利用率仅45%的问题,引入Capacity Scheduler自定义队列策略(按营销活动、日常报表划分优先级),结合Prometheus监控的CPU/内存使用率实现资源弹性伸缩;同时优化任务调度算法,将长任务(如月度报表)与短任务(如实时监控)分时段调度,资源利用率提升至72%,年节省云服务器成本约350万元
  • 推动平台易用性提升,针对数据开发人员SQL调试效率低的反馈,开发基于Vue.js的前端SQL调试工具,集成Apache Calcite实现语法校验与执行计划预览,对接元数据系统实现字段级血缘可视化;工具上线后,SQL调试平均时间从45分钟缩短至15分钟,数据开发团队满意度提升至92%
2020.08 - 2023.06
小楷零售科技
大数据开发工程师

负责零售公司大数据平台离线计算模块开发与性能优化,支撑商品库存、销售预测核心业务的数据处理需求,逐步参与平台架构设计与标准化建设

  • 主导优化基于Hive的销售数据离线计算链路,针对月末销售汇总报表生成时间从8小时延长至12小时的问题,分析MapReduce任务shuffle瓶颈与小文件过多痛点;采用Hive 3.x Vectorization向量化执行与Tez引擎替换MapReduce,结合HDFS合并小文件工具(Shell+HDFS API)将小文件数量从150万+降至30万内,shuffle数据量减少40%;最终报表生成时间缩短至5小时内,支撑月末财务结算及时性,结算周期缩短3天
  • 核心参与数据仓库分层体系建设,基于Kimball维度建模理论设计ODS-DWD-DWS三层架构;其中DWD层用Spark SQL实现用户行为数据清洗关联(整合APP点击、下单、支付数据),DWS层构建用户画像宽表(包含人口属性、消费偏好、行为特征20+维度);体系上线后,上层业务取数效率提升60%,重复计算减少70%,支撑商品运营团队精准选品
  • 搭建平台任务监控与报警系统,针对原有仅覆盖作业成败的监控盲区,采用Prometheus+Grafana实现任务运行时指标监控(CPU、内存、shuffle读写量),结合Alertmanager设置阈值报警(如shuffle超1TB触发预警);系统上线后,任务故障发现时间从30分钟缩短至5分钟内,减少业务数据延迟影响,关键任务故障率下降65%
  • 推动数据标准落地,主导制定《零售数据字段命名规范》《ETL流程开发指南》,通过平台脚本校验ETL任务的字段命名与逻辑合规性,将数据质量问题率从12%降至3%,降低下游业务的数据清洗成本
2018.07 - 2020.07
小楷互联网科技
数据开发工程师

负责互联网公司基础数据处理与ETL流程开发,支撑用户增长、运营活动的简单数据需求,初步接触平台化工具的使用与优化

  • 主导开发用户行为数据ETL流程,从APP埋点JSON日志到Hive表的清洗转换,采用Python Scrapy采集埋点日志,结合PySpark解析用户ID、行为类型、页面路径等字段并去重;流程上线后,每日处理日志量从500GB增长至1.2TB,支撑运营团队对用户行为的初步分析,用户留存率策略调整周期缩短2天
  • 优化Hive用户标签表存储结构,针对查询慢问题将行存储改为ORC列存储并开启Snappy压缩,同步优化分区策略为周分区+动态分区;优化后标签查询耗时从2分钟降至30秒内,支撑营销活动用户分群效率提升,活动触达准确率提升15%
  • 参与搭建Tableau数据看板,连接Hive数据开发用户增长看板(新增用户、活跃用户、留存率),支撑运营团队实时查看用户增长情况,当月新增用户转化率提升12%
  • 协助搭建ETL任务调度系统,基于Airflow编写DAG任务,实现日志采集、数据清洗、加载的自动化调度,任务成功率从85%提升至95%,减少人工干预成本
技能特长
沟通能力
执行能力
热情坦诚
文案能力
兴趣爱好
摄影
看书
阅读
跑步
自我评价
  • 深耕互联网数据平台全链路开发,以业务价值为核心设计高可用架构,用模块化方案平衡数据孤岛与实时查询性能,支撑亿级用户行为数据的存储分析。
  • 养成根因导向的问题解决习惯,面对分布式系统隐式故障,能快速串联日志、链路追踪与业务指标定位瓶颈,推动响应效率提升。
  • 擅长与业务、算法团队同频沟通,将业务需求翻译成技术方案,也将技术约束反馈上游,形成双向对齐的协作闭环。
  • 主动跟踪湖仓一体、实时数仓等行业趋势,提前预研并试点,为平台升级储备可复用的技术能力。
  • INTEGRITY
    信守承诺,基石所在
  • AGILITY
    敏捷进化,适应未来
  • SYNERGY
    聚力协同,创造共赢
试一下,换个颜色
选择配色
使用此模板创建简历
  • 支持电脑端、微信小程序编辑简历
  • 支持一键更换模板,自由调整字距行距
  • 支持微信分享简历给好友查看
  • 支持简历封面、自荐信、自定义简历模块
  • 支持导出为PDF、图片、在线打印、云端保存
该简历模板已内置
  • 个人名称
  • 头像
  • 基本信息
  • 求职意向
  • 工作经历
  • 项目经验
  • 实习经验
  • 作品展示
  • 奖项荣誉
  • 校园经历
  • 教育背景
  • 兴趣爱好
  • 技能特长
  • 语言能力
  • 自我评价
  • 报考信息
  • 简历封面
  • 自荐信
对话框
提示
说明