当前模板已根据「数据仓库开发工程师」岗位深度优化
选择其他岗位
开始编辑模板后,您可以进一步自定义包括:工作履历、工作内容、信息模块、颜色配置等
内置经深度优化的履历,将为你撰写个人简历带来更多灵感。
陆明哲的照片
陆明哲
昨天的经验是今天的基石,而今天的突破将成为明天的标准。
28岁
3年工作经验
13800138000
DB@zjengine.com
求职意向
数据仓库开发工程师
宁波
薪资面谈
到岗时间另议
工作经历
2021.09 - 2023.04
小楷闪购科技有限公司
数据仓库技术负责人
  • 领导团队完成了公司数据平台从“传统Hadoop架构”到“现代云原生数据栈”的升级迁移。新栈采用“MaxCompute + DataWorks + Hologres”,通过精心的数据同步和切换方案,实现了“平滑迁移、零数据丢失、业务无感知”,整体计算和存储成本下降40%。
  • 引入并落地了“数据建模与ETL开发规范”,统一了数据分层(ODS, DWD, DWS, ADS)、命名和开发标准,使数仓结构清晰易懂,新成员上手速度加快50%,代码可维护性大幅提升。
  • 构建了“统一的数据服务层”,通过配置化方式将数据表快速生成低延迟的API接口,屏蔽底层存储复杂性,支撑了20+个数据应用的上线,数据价值交付速度提升200%。
2020.02 - 2021.08
小楷闪购科技有限公司
数据仓库开发工程师
  • 负责“用户行为日志数据”的采集、清洗和建模,构建了完善的“用户行为数据体系”,为用户画像、推荐系统、增长分析提供了坚实的数据基础。
  • 使用Hive SQL和Spark开发了复杂的ETL任务,处理日增TB级的数据,并保证了任务的稳定高效运行。
  • 积极参与数据需求评审,能从业务角度理解数据需求,并转化为合理的数据模型设计。
项目经验
2022.03 - 2023.08
星途互动科技有限公司
大数据开发负责人

社交产品实时用户行为数仓构建及推荐特征优化项目

  • 项目背景:公司核心社交APP用户增长陷入停滞,推荐系统因依赖离线特征导致实时性不足,CTR较行业均值低18%,DAU连续3个月未突破800万。核心目标是通过构建实时用户行为数仓,支撑推荐系统毫秒级特征计算,提升流量转化效率。我的职责是主导全链路技术方案设计,协调算法、产品、前端团队对齐特征口径与迭代节奏。
  • 解决的关键难题:1)多源数据(APP、小程序、H5)的schema频繁变更(月均12次),传统离线数仓无法适配实时场景;2)实时特征计算需兼顾低延迟(<100ms)与状态一致性,Flink任务偶发checkpoint失败导致数据延迟;3)业务线特征重复开发,计算资源利用率仅35%。技术上采用Flink CDC同步MySQL用户属性,结合Schema Registry实现schema动态映射,解决多源数据一致性问题;通过RocksDB状态后端+增量checkpoint优化,将任务失败率从8%降至1%以下。
  • 核心行动与创新:牵头设计实时数仓四层模型(ODS原始行为层->DWD事件关联层->DWS用户行为宽表层->ADS推荐特征层),其中DWD层通过Flink SQL实现“用户点击-评论-转发”全链路事件关联;针对推荐系统需求,开发“好友互动热度标签”“近期兴趣衰减特征”等23个实时特征,接入公司特征平台实现秒级更新;引入Redis Cluster做特征缓存,将高频特征访问延迟从500ms压降至70ms以内。此外,设计“业务变更-特征同步”的自动化流程,减少人工干预80%。
  • 项目成果:实时数仓延迟稳定在80ms内,推荐系统CTR提升22%至行业均值以上,DAU增长15%至920万;特征复用率从35%提升至72%,每月节省30%离线计算资源(约120台EMR节点);项目支撑“兴趣feed流”核心功能上线,成为Q3公司DAU增长的主要驱动。个人主导的技术方案被纳入公司大数据实时开发规范,带教3名初级工程师掌握实时数仓设计与特征开发能力。
2021.06 - 2022.02
星途互动科技有限公司
大数据开发工程师

用户行为数据湖成本治理与价值激活项目

  • 项目背景:公司用户行为数据湖(HDFS+Iceberg)存储规模达120PB,年存储成本超800万,且因元数据混乱、数据冗余,业务部门取数耗时平均2小时,35%数据半年内未被访问。核心目标是降低存储成本30%,提升查询性能50%,激活沉睡数据价值。我的职责是主导数据湖重构与治理,梳理数据资产并优化存储查询效率。
  • 解决的关键难题:1)元数据缺失导致重复数据达40%(如同一用户行为日志被多任务写入不同目录);2)查询未利用Iceberg分区与索引能力,常扫描全表数据;3)缺乏生命周期策略,冷数据未及时归档。技术上采用Apache Atlas搭建元数据平台,追踪数据lineage识别冗余;优化Iceberg表分区为“日期+用户地域”(原始层)与“行为类型+时间窗口”(聚合层),提升查询剪枝效率;引入数据血缘工具自动标记沉睡数据。
  • 核心行动与创新:完成全量数据盘点,清理42PB重复数据;重构“原始层-清洗层-聚合层-归档层”四层模型,原始数据迁移至OSS冷存储,聚合数据同步至ClickHouse做OLAP查询;制定生命周期策略:原始数据保留3年、清洗数据保留2年、归档数据每月迁移至冷存储并删除冗余副本。此外,为“用户日活”“行为转化率”等高频查询创建物化视图,预计算指标减少实时计算量。
  • 项目成果:存储成本降低35%至每年520万,查询性能提升60%,业务取数时间缩短至15分钟内;激活12个沉睡数据集,支撑运营部“老用户召回活动”转化率提升18%、产品部“用户画像优化”项目落地;个人主导的数据治理流程推广至全公司,成为后续数据湖建设标准规范,本人获公司“年度数据价值贡献奖”。
奖项荣誉
  • 数据库系统工程师(中级)
  • 2023年度公司项目攻坚奖
  • 2024年部门优秀技术员工
技能特长
沟通能力
执行能力
热情坦诚
文案能力
自我评价
  • 深耕互联网数据仓库,以业务价值为核心搭底层架构——既用维度建模支撑运营、用户场景快速取数,也预判业务增长做分层解耦。
  • 从数据全生命周期抓质量,不仅埋点ETL校验规则,更联动业务梳理指标口径,把“准确”变可落地机制。
  • 对查询性能有极致敏感,从执行计划反推优化点,更沉淀可复用checklist避免重复踩坑。
  • 跨团队用双方语言桥接——和产品聊需求会问“指标未来扩展吗”,和技术讲场景痛点,拒绝无效做数据。
试一下,换个颜色
选择配色
使用此模板创建简历
  • 支持电脑端、微信小程序编辑简历
  • 支持一键更换模板,自由调整字距行距
  • 支持微信分享简历给好友查看
  • 支持简历封面、自荐信、自定义简历模块
  • 支持导出为PDF、图片、在线打印、云端保存
该简历模板已内置
  • 个人名称
  • 头像
  • 基本信息
  • 求职意向
  • 工作经历
  • 项目经验
  • 实习经验
  • 作品展示
  • 奖项荣誉
  • 校园经历
  • 教育背景
  • 兴趣爱好
  • 技能特长
  • 语言能力
  • 自我评价
  • 报考信息
  • 简历封面
  • 自荐信
对话框
提示
说明