当前模板已根据「数据仓库开发工程师」岗位深度优化
选择其他岗位
开始编辑模板后,您可以进一步自定义包括:工作履历、工作内容、信息模块、颜色配置等
内置经深度优化的履历,将为你撰写个人简历带来更多灵感。
陆明哲
用系统化的思维解决问题,用温度化的方式交付成果,这是我的工作准则。
28岁
3年工作经验
13800138000
DB@zjengine.com
陆明哲的照片
求职意向
数据仓库开发工程师
宁波
薪资面谈
到岗时间另议
工作经历
2021.12 - 2023.07
小楷闪购科技有限公司
数据仓库效能专家
  • 主导公司数据仓库的“全面成本治理”专项,通过构建“成本监控与分摊”系统,将计算和存储成本精准核算到每个部门、每个项目甚至每个员工,使之前“看不见”的成本变得完全透明,公司整体大数据成本因此降低30%。
  • 实现的“智能生命周期管理”策略,基于数据热度自动将冷数据从昂贵的高性能存储tier归档至低成本对象存储,在几乎不影响查询体验的前提下,节省存储费用40%。
  • 深耕“查询性能优化”,建立了从“SQL编写规范、数据模型设计、计算参数调优”的全链路优化体系。通过代码扫描工具自动检测不合理的SQL写法,并组织培训,使全公司的查询效率整体提升25%,无效计算资源消耗大幅减少。
  • 其工作成果形成了《数据仓库优化白皮书》,成为公司数据团队的操作手册,并每年定期开展“成本优化周”活动,形成了良好的技术文化。
2020.03 - 2021.11
小楷闪购科技有限公司
数据开发工程师
  • 负责“日志数据仓库”的开发和维护,每日处理TB级的用户行为数据,为各类分析报表提供数据支撑。
  • 在任务中主动实践成本优化,通过“数据压缩、分区裁剪、谓词下推”等手段,将自己负责的任务资源消耗降低了50%,获得了团队的认可。
  • 开始深入研究大数据生态组件的原理,如HDFS、YARN、Hive的执行机制,为后续的深度优化工作打下了坚实的理论基础。
项目经验
2022.03 - 2023.08
星途互动科技有限公司
大数据开发负责人

社交产品实时用户行为数仓构建及推荐特征优化项目

  • 项目背景:公司核心社交APP用户增长陷入停滞,推荐系统因依赖离线特征导致实时性不足,CTR较行业均值低18%,DAU连续3个月未突破800万。核心目标是通过构建实时用户行为数仓,支撑推荐系统毫秒级特征计算,提升流量转化效率。我的职责是主导全链路技术方案设计,协调算法、产品、前端团队对齐特征口径与迭代节奏。
  • 解决的关键难题:1)多源数据(APP、小程序、H5)的schema频繁变更(月均12次),传统离线数仓无法适配实时场景;2)实时特征计算需兼顾低延迟(<100ms)与状态一致性,Flink任务偶发checkpoint失败导致数据延迟;3)业务线特征重复开发,计算资源利用率仅35%。技术上采用Flink CDC同步MySQL用户属性,结合Schema Registry实现schema动态映射,解决多源数据一致性问题;通过RocksDB状态后端+增量checkpoint优化,将任务失败率从8%降至1%以下。
  • 核心行动与创新:牵头设计实时数仓四层模型(ODS原始行为层->DWD事件关联层->DWS用户行为宽表层->ADS推荐特征层),其中DWD层通过Flink SQL实现“用户点击-评论-转发”全链路事件关联;针对推荐系统需求,开发“好友互动热度标签”“近期兴趣衰减特征”等23个实时特征,接入公司特征平台实现秒级更新;引入Redis Cluster做特征缓存,将高频特征访问延迟从500ms压降至70ms以内。此外,设计“业务变更-特征同步”的自动化流程,减少人工干预80%。
  • 项目成果:实时数仓延迟稳定在80ms内,推荐系统CTR提升22%至行业均值以上,DAU增长15%至920万;特征复用率从35%提升至72%,每月节省30%离线计算资源(约120台EMR节点);项目支撑“兴趣feed流”核心功能上线,成为Q3公司DAU增长的主要驱动。个人主导的技术方案被纳入公司大数据实时开发规范,带教3名初级工程师掌握实时数仓设计与特征开发能力。
2021.06 - 2022.02
星途互动科技有限公司
大数据开发工程师

用户行为数据湖成本治理与价值激活项目

  • 项目背景:公司用户行为数据湖(HDFS+Iceberg)存储规模达120PB,年存储成本超800万,且因元数据混乱、数据冗余,业务部门取数耗时平均2小时,35%数据半年内未被访问。核心目标是降低存储成本30%,提升查询性能50%,激活沉睡数据价值。我的职责是主导数据湖重构与治理,梳理数据资产并优化存储查询效率。
  • 解决的关键难题:1)元数据缺失导致重复数据达40%(如同一用户行为日志被多任务写入不同目录);2)查询未利用Iceberg分区与索引能力,常扫描全表数据;3)缺乏生命周期策略,冷数据未及时归档。技术上采用Apache Atlas搭建元数据平台,追踪数据lineage识别冗余;优化Iceberg表分区为“日期+用户地域”(原始层)与“行为类型+时间窗口”(聚合层),提升查询剪枝效率;引入数据血缘工具自动标记沉睡数据。
  • 核心行动与创新:完成全量数据盘点,清理42PB重复数据;重构“原始层-清洗层-聚合层-归档层”四层模型,原始数据迁移至OSS冷存储,聚合数据同步至ClickHouse做OLAP查询;制定生命周期策略:原始数据保留3年、清洗数据保留2年、归档数据每月迁移至冷存储并删除冗余副本。此外,为“用户日活”“行为转化率”等高频查询创建物化视图,预计算指标减少实时计算量。
  • 项目成果:存储成本降低35%至每年520万,查询性能提升60%,业务取数时间缩短至15分钟内;激活12个沉睡数据集,支撑运营部“老用户召回活动”转化率提升18%、产品部“用户画像优化”项目落地;个人主导的数据治理流程推广至全公司,成为后续数据湖建设标准规范,本人获公司“年度数据价值贡献奖”。
技能特长
沟通能力
执行能力
热情坦诚
文案能力
奖项荣誉
  • 计算机技术与软件专业技术资格(水平)证书(中级:数据库系统工程师)
  • 2022年度公司项目攻坚奖
  • 2023年公司优秀技术员工
自我评价
  • 深耕互联网数据仓库领域,擅长从用户行为、交易等业务链路拆解需求,将模糊业务目标转化为分层可扩展的数仓架构,支撑多场景分析。
  • 面对海量ETL瓶颈,习惯用“分层诊断+链路优化”思维,从数据倾斜到资源调度逐一突破,推动核心流程效率显著提升。
  • 主动联动业务与研发,以“业务语言+技术逻辑”双向翻译,推动指标体系标准化,减少跨团队沟通损耗。
  • 关注流批一体等行业趋势,将其融入现有架构,提前布局支持业务快速迭代,保持数仓对需求的敏捷响应。
试一下,换个颜色
选择配色
使用此模板创建简历
  • 支持电脑端、微信小程序编辑简历
  • 支持一键更换模板,自由调整字距行距
  • 支持微信分享简历给好友查看
  • 支持简历封面、自荐信、自定义简历模块
  • 支持导出为PDF、图片、在线打印、云端保存
该简历模板已内置
  • 个人名称
  • 头像
  • 基本信息
  • 求职意向
  • 工作经历
  • 项目经验
  • 实习经验
  • 作品展示
  • 奖项荣誉
  • 校园经历
  • 教育背景
  • 兴趣爱好
  • 技能特长
  • 语言能力
  • 自我评价
  • 报考信息
  • 简历封面
  • 自荐信
对话框
提示
说明