当前模板已根据「数据平台开发工程师」岗位深度优化
选择其他岗位
开始编辑模板后,您可以进一步自定义包括:工作履历、工作内容、信息模块、颜色配置等
内置经深度优化的履历,将为你撰写个人简历带来更多灵感。
陆明哲
昨天的经验是今天的基石,而今天的突破将成为明天的标准。
28岁
3年工作经验
13800138000
DB@zjengine.com
陆明哲的照片
求职意向
数据平台开发工程师
苏州
薪资面谈
到岗时间另议
工作经历
2023.07 - 2025.06
小楷电商科技
数据平台开发工程师

负责公司大数据基础平台核心模块(元数据管理、实时计算链路、资源调度)的架构设计与迭代,聚焦平台稳定性、性能优化及对电商营销、用户运营等上层业务的支撑能力提升

  • 主导设计并落地基于Apache Doris的统一元数据管理系统,针对原有元数据分散在Hive、ClickHouse、Kafka的痛点,采用Apache Atlas对接各数据源,结合自研Java+Canal元数据同步工具,实现跨源元数据实时采集与一致性校验;通过Atlas图数据库模型优化元数据关联查询逻辑,将元数据检索耗时从平均12s降至2s内,支撑数据治理团队对10万+张表的快速定位与血缘分析,元数据管理效率提升80%
  • 核心参与双11大促实时计算链路扩容,针对实时订单流处理延迟从500ms攀升至2s的问题,定位到Flink作业并行度不足与RocksDB状态后端性能瓶颈;采用Flink Adaptive Scheduler动态调整并行度,替换为Apache Pravega高吞吐状态存储,同步调整batch size至5000减少IO开销;最终大促期间实时订单处理延迟稳定在300ms内,支撑营销活动实时用户行为分析与优惠券精准推送,活动转化率提升18%
  • 负责YARN集群资源调度模块优化,针对资源利用率仅45%的问题,引入Capacity Scheduler自定义队列策略(按营销活动、日常报表划分优先级),结合Prometheus监控的CPU/内存使用率实现资源弹性伸缩;同时优化任务调度算法,将长任务(如月度报表)与短任务(如实时监控)分时段调度,资源利用率提升至72%,年节省云服务器成本约350万元
  • 推动平台易用性提升,针对数据开发人员SQL调试效率低的反馈,开发基于Vue.js的前端SQL调试工具,集成Apache Calcite实现语法校验与执行计划预览,对接元数据系统实现字段级血缘可视化;工具上线后,SQL调试平均时间从45分钟缩短至15分钟,数据开发团队满意度提升至92%
2020.08 - 2023.06
小楷零售科技
大数据开发工程师

负责零售公司大数据平台离线计算模块开发与性能优化,支撑商品库存、销售预测核心业务的数据处理需求,逐步参与平台架构设计与标准化建设

  • 主导优化基于Hive的销售数据离线计算链路,针对月末销售汇总报表生成时间从8小时延长至12小时的问题,分析MapReduce任务shuffle瓶颈与小文件过多痛点;采用Hive 3.x Vectorization向量化执行与Tez引擎替换MapReduce,结合HDFS合并小文件工具(Shell+HDFS API)将小文件数量从150万+降至30万内,shuffle数据量减少40%;最终报表生成时间缩短至5小时内,支撑月末财务结算及时性,结算周期缩短3天
  • 核心参与数据仓库分层体系建设,基于Kimball维度建模理论设计ODS-DWD-DWS三层架构;其中DWD层用Spark SQL实现用户行为数据清洗关联(整合APP点击、下单、支付数据),DWS层构建用户画像宽表(包含人口属性、消费偏好、行为特征20+维度);体系上线后,上层业务取数效率提升60%,重复计算减少70%,支撑商品运营团队精准选品
  • 搭建平台任务监控与报警系统,针对原有仅覆盖作业成败的监控盲区,采用Prometheus+Grafana实现任务运行时指标监控(CPU、内存、shuffle读写量),结合Alertmanager设置阈值报警(如shuffle超1TB触发预警);系统上线后,任务故障发现时间从30分钟缩短至5分钟内,减少业务数据延迟影响,关键任务故障率下降65%
  • 推动数据标准落地,主导制定《零售数据字段命名规范》《ETL流程开发指南》,通过平台脚本校验ETL任务的字段命名与逻辑合规性,将数据质量问题率从12%降至3%,降低下游业务的数据清洗成本
2018.07 - 2020.07
小楷互联网科技
数据开发工程师

负责互联网公司基础数据处理与ETL流程开发,支撑用户增长、运营活动的简单数据需求,初步接触平台化工具的使用与优化

  • 主导开发用户行为数据ETL流程,从APP埋点JSON日志到Hive表的清洗转换,采用Python Scrapy采集埋点日志,结合PySpark解析用户ID、行为类型、页面路径等字段并去重;流程上线后,每日处理日志量从500GB增长至1.2TB,支撑运营团队对用户行为的初步分析,用户留存率策略调整周期缩短2天
  • 优化Hive用户标签表存储结构,针对查询慢问题将行存储改为ORC列存储并开启Snappy压缩,同步优化分区策略为周分区+动态分区;优化后标签查询耗时从2分钟降至30秒内,支撑营销活动用户分群效率提升,活动触达准确率提升15%
  • 参与搭建Tableau数据看板,连接Hive数据开发用户增长看板(新增用户、活跃用户、留存率),支撑运营团队实时查看用户增长情况,当月新增用户转化率提升12%
  • 协助搭建ETL任务调度系统,基于Airflow编写DAG任务,实现日志采集、数据清洗、加载的自动化调度,任务成功率从85%提升至95%,减少人工干预成本
项目经验
2022.05 - 2023.08
星途互动
大数据分析平台负责人

用户行为实时分析平台重构与规模化落地项目

  • 背景:原平台基于Apache Storm构建,存在延迟高(平均5s+)、复杂事件处理能力弱、多源数据(埋点/Kafka/MySQL Binlog)schema兼容困难等问题,无法支撑运营团队对活动效果实时监控、用户转化路径实时分析的需求;核心目标是重构至分布式实时计算架构,实现毫秒级延迟与复杂场景全覆盖。
  • 难点:Storm拓扑的“ spaghetti code”难以维护,多源数据schema动态变更会导致计算逻辑失效;实时计算中“用户30分钟内连续点击3个商品详情页”这类复杂事件的匹配效率低。解决方案:选用Apache Flink替代Storm(基于其低延迟、Exactly-Once语义与内置CEP引擎);引入Confluent Schema Registry管理多源数据schema,支持动态兼容;自研基于Flink Java API的复杂事件处理器,通过状态存储用户行为序列实现高效匹配。
  • 行动:主导技术选型与全链路架构设计,搭建“数据采集(Kafka+Canal)- 实时计算(Flink)- 结果存储(ClickHouse+Redis)”流程;针对运营需求封装通用指标库(如实时DAU、转化漏斗、页面停留时长分位数),通过Flink SQL实现“配置化指标开发”降低使用门槛;与运维团队协作建立覆盖数据延迟、计算成功率、资源利用率的12项实时监控体系。
  • 成果:平台延迟降至800ms以内,支持15万TPS并发,覆盖8条业务线的实时运营场景(如618大促期间实时监控活动页转化率,助力运营调整优惠券策略,活动GMV提升18%);沉淀《实时数据处理架构规范》《复杂事件处理最佳实践》,个人获公司“年度技术创新奖”。
2020.03 - 2021.12
星途互动
大数据开发工程师

用户实时画像与标签推荐系统开发项目

  • 背景:原用户画像依赖Hive离线计算(T+1更新),无法支撑推荐系统的实时个性化需求(如用户刚浏览商品后立即调整推荐列表);目标是实现用户画像分钟级更新,提供实时标签供推荐引擎调用。个人负责实时数据处理与标签计算核心模块。
  • 难点:离线标签逻辑分散在20+个Shell/Python脚本中,维护成本高;实时计算中用户历史行为的“状态保持”(如近7天浏览的商品类别)会占用大量内存,导致作业频繁OOM。解决方案:梳理现有标签体系(基础属性/行为偏好/实时兴趣三类),将逻辑迁移至Flink;采用RocksDB作为Flink状态后端,将用户行为序列存储至HBase,状态仅保留“当前计算窗口”关键信息以降低内存消耗。
  • 行动:搭建“行为数据采集(Kafka)- 实时计算(Flink)- 画像存储(HBase+Redis)”链路,将用户行为数据实时同步至HBase宽表,同时用Flink计算“最近10分钟浏览的手机品类”“近1小时活跃度等级”等实时标签;优化Flink作业并行度与checkpoint策略,将作业恢复时间从15分钟缩短至2分钟;推动标签体系标准化,定义“创建-测试-上线-下线”的生命周期管理流程。
  • 成果:用户画像更新时间从T+1缩短至3分钟,推荐系统实时点击率提升22%;标签覆盖率从75%提升至92%,减少推荐引擎空值处理成本;主导的“实时画像标签体系”纳入公司数据中台核心组件,支撑电商、内容两条业务线的推荐场景。
技能特长
沟通能力
执行能力
热情坦诚
文案能力
自我评价
  • 深耕互联网数据平台全链路开发,擅长从业务需求倒推底层架构,用“分层解耦+弹性扩展”解决高并发数据流转瓶颈。
  • 始终站在业务侧拆解数据诉求,将抽象指标转化为可落地方案,确保数据能力匹配业务决策节奏。
  • 主动挖掘隐性数据痛点,不局限于执行,曾牵头梳理跨部门口径问题,推动统一元数据管理机制落地。
  • 擅长用技术语言衔接业务与工程团队,快速对齐认知差异,让平台更贴合实际使用场景。
试一下,换个颜色
选择配色
使用此模板创建简历
  • 支持电脑端、微信小程序编辑简历
  • 支持一键更换模板,自由调整字距行距
  • 支持微信分享简历给好友查看
  • 支持简历封面、自荐信、自定义简历模块
  • 支持导出为PDF、图片、在线打印、云端保存
该简历模板已内置
  • 个人名称
  • 头像
  • 基本信息
  • 求职意向
  • 工作经历
  • 项目经验
  • 实习经验
  • 作品展示
  • 奖项荣誉
  • 校园经历
  • 教育背景
  • 兴趣爱好
  • 技能特长
  • 语言能力
  • 自我评价
  • 报考信息
  • 简历封面
  • 自荐信
对话框
提示
说明