当前模板已根据「数据仓库开发工程师」岗位深度优化
选择其他岗位
开始编辑模板后,您可以进一步自定义包括:工作履历、工作内容、信息模块、颜色配置等
内置经深度优化的履历,将为你撰写个人简历带来更多灵感。
陆明哲
在平凡的岗位上创造不平凡的价值,这是我的职业信仰。
28岁
3年工作经验
13800138000
DB@zjengine.com
陆明哲的照片
求职意向
数据仓库开发工程师
宁波
薪资面谈
一个月内到岗
工作经历
2024.06 - 至今
小楷集团数据中台
资深数据仓库开发工程师

负责集团级数据仓库整体架构设计与迭代,主导跨事业群数据整合与元数据治理,支撑零售、本地生活、金融三大业务线的深度数据分析需求,推动离线-实时数仓融合架构落地。

  • 主导设计集团统一维度中心,基于Kimball维度建模理论重构用户、商品、交易三大核心主题域,通过引入缓慢变化维(SCD)Type2+Type3混合策略,解决历史状态追溯与实时属性更新的冲突问题;同步搭建维度元数据管理模块,对接Apache Atlas实现维度血缘自动采集,维度变更影响分析耗时从4小时缩短至15分钟。
  • 牵头离线-实时数仓融合项目,基于Flink完成订单、支付等核心链路实时ETL开发,结合Hudi增量存储与Hive离线批处理,实现T+0实时看板与T+1深度报表的同源数据供给;针对大促期间实时数据延迟问题,优化Flink窗口计算逻辑并引入本地状态缓存,将订单流处理延迟从8秒压降至2秒内。
  • 设计数据质量全链路监控体系,基于DataWorks规则引擎自定义200+校验规则(完整性、一致性、准确性),开发异常数据自动拦截与告警流程;上线后关键业务表数据错误率从0.3%降至0.05%,月度数据回溯成本减少60%。
  • 推动数据资产分级分类落地,结合业务场景定义高价值数据标签(如GMV核心链、用户LTV预测链),通过元数据平台开放自助取数入口,支撑业务团队自主查询效率提升70%,跨部门数据协作工单量下降45%。
2022.07 - 2024.05
小楷零售科技
高级数据仓库开发工程师

聚焦零售业务线数据仓库核心建设,负责交易、会员、供应链三大域的数据模型设计与ETL开发,支撑营销活动效果分析、库存周转优化等关键业务场景。

  • 主导会员数据分层建模,基于RFM模型扩展用户价值标签体系,通过Spark SQL实现多源会员数据(APP、小程序、线下POS)的清洗与关联,解决跨端用户ID映射不一致问题;建模后会员画像覆盖率从82%提升至98%,支撑精准营销转化率提升18%。
  • 优化供应链数据链路,针对采购-仓储-销售全流程数据滞后问题,重构ETL调度逻辑:将传统T+1批处理拆分为小时级增量同步与夜间全量校验,结合Hive分区裁剪与列式存储优化,供应链报表产出时效从早8点提前至凌晨3点,业务决策响应速度显著加快。
  • 攻克大促期间数据仓库稳定性难题,通过分析历史负载发现促销活动表写入并发过高导致集群资源争抢;采用动态资源分配策略(YARN队列优先级调整)与写入限流机制(每批次数据量阈值控制),大促峰值期间集群CPU利用率从95%降至75%,数据积压率保持0异常。
  • 搭建数据血缘可视化平台,基于SQL解析工具提取ETL任务依赖关系,手动补全元数据缺失节点,实现从业务指标到原始表的穿透式追踪;上线后数据问题定位时间从平均2小时缩短至10分钟,支撑数据治理团队效率提升50%。
2020.07 - 2022.06
小楷电商科技
数据仓库开发工程师(初级-中级)

负责电商用户行为数据与交易数据的ETL开发及基础数据层建设,支撑运营团队的流量分析、转化漏斗等基础数据需求,保障数据准确性与时效性。

  • 独立完成用户行为日志(APP点击流、埋点数据)的结构化处理,使用Flume完成日志采集,通过Scala编写Spark作业实现非结构化日志(JSON格式)的字段提取与清洗;针对日志乱码率高问题,开发自动编码检测脚本(基于ICU库),数据可用率从92%提升至99.5%。
  • 设计交易数据宽表模型,整合订单头信息、商品明细、支付状态等多表数据,采用星型模型降低查询复杂度;同步开发增量更新逻辑(基于最后更新时间戳),替代原有的全量刷新模式,每日数据处理量从10亿条减少至2亿条,集群IO压力下降60%。
  • 搭建基础数据质量监控模板,针对订单金额、用户ID等关键字段配置非空、唯一性、值域校验规则,通过Shell脚本定时执行校验并输出异常报告;上线3个月内拦截脏数据12万条,避免因数据错误导致的运营决策偏差。
  • 支撑大促活动效果分析需求,快速响应运营团队对新增维度(如直播间引流渠道)的取数要求,通过临时表设计与维度关联优化,在3天内完成数据准备;活动期间日均处理查询请求150+次,响应时效稳定在5分钟内。
项目经验
2022.03 - 2023.08
星途互动科技有限公司
大数据开发负责人

星途直播平台实时用户行为分析系统重构与性能优化

  • 项目背景:直播业务进入精细化运营阶段,原有离线Hadoop MapReduce架构的实时用户行为分析系统存在严重延迟(平均2小时),无法支撑运营团队对直播间热度、礼物转化、用户流失的分钟级决策需求。核心目标是将系统升级为流批一体的实时数仓,将关键指标延迟降至10秒内,同时支撑日均1亿条用户行为数据的处理。我在项目中主导技术方案设计、跨部门需求对齐及全链路落地。
  • 关键难题:1)原有烟囱式架构导致数据重复计算,资源浪费率达40%;2)Kafka分区策略固定,高峰期单分区吞吐量超上限引发热点;3)实时聚合查询依赖全表扫描,95%的ad-hoc查询响应时间超过30秒;4)Flink任务频繁因状态过大导致Checkpoint失败,稳定性不足。
  • 核心行动与创新:1)架构升级:采用Kappa架构整合Flink 1.17做实时计算、Apache Hudi 0.12做实时数据湖存储,实现“实时写入-增量计算-实时查询”流批一体链路;2)Kafka优化:基于主播粉丝量、礼物热度的动态分区算法,将分区数从32个扩展至64个,并自定义分区器分散热点数据;3)查询加速:构建“Hudi实时表+Flink SQL预聚合+Apache Druid二级索引”的双层架构,预计算12个核心指标(如实时在线人数、礼物转化率),将查询响应时间压缩至5秒内;4)稳定性保障:引入Flink增量Checkpoint、状态TTL清理机制,结合YARN Capacity Scheduler做任务队列隔离,将任务失败率从8%降至0.5%。
  • 项目成果:1)实时数据延迟从2小时降至5秒内,95%指标延迟<10秒,支撑大促期间单日10万场直播的实时运营;2)系统吞吐量从每小时100万条提升至1.2亿条,资源成本下降35%;3)运营团队决策效率提升70%,活动期间礼物策略调整从小时级缩短至分钟级,带动直播间ARPU提升18%;4)主导输出《直播实时数仓技术规范》,成为公司同类项目的技术标准,个人晋升为大数据开发负责人。
2020.06 - 2022.02
星途互动科技有限公司
大数据开发工程师

电商用户生命周期数据中台建设

  • 项目背景:公司电商业务用户数据分散在CRM、订单、行为日志等10+系统,缺乏统一的用户标签体系和生命周期管理,精准营销转化率仅3%。核心目标是搭建用户生命周期数据中台,整合多源数据生成300+用户标签,支撑运营团队对“拉新-促活-留存-转化”全链路的精准触达。我在项目中负责数据采集、ETL整合、标签计算及平台对接。
  • 关键难题:1)多源数据schema不一致,比如CRM用户属性为MySQL宽表,订单数据为Oracle事务表,行为日志为JSON半结构化数据;2)标签计算时效性差,如“最近30天复购率”需T+1更新,无法支撑实时营销;3)标签准确性低,因缺乏一致性校验,部分标签错误率超20%;4)隐私数据安全风险,用户手机号、地址等信息未加密存储。
  • 核心行动与创新:1)数据整合:用Flume采集行为日志、Sqoop同步关系型数据库,通过Spark ETL清洗转换,建立统一用户宽表(包含用户ID、消费金额、浏览时长等50+字段),采用星型模型优化查询性能;2)标签体系设计:基于RFM模型(最近消费、消费频率、消费金额)和行为特征(收藏、加购、分享),开发批量标签(如“高价值用户”)与实时标签(如“最近7天登录用户”),用Flink实现标签分钟级更新;3)质量管控:引入数据校验规则引擎(Great Expectations),对标签字段做唯一性、完整性、一致性检查,将错误率降至3%以内;4)安全合规:用AES-256加密用户隐私字段,结合Apache Ranger做权限分级,实现“看数据不碰数据”的安全访问。
  • 项目成果:1)整合10+数据源的2PB用户数据,建立公司首个统一用户数据仓库;2)生成320个用户标签,标签准确率从70%提升至95%,覆盖90%的运营场景;3)精准营销转化率提升45%,营销成本下降28%,支撑“双11”期间新用户留存率提升20%;4)数据中台成为公司用户增长的核心引擎,支撑了“潜力用户运营”“高价值用户召回”等多个重点项目,个人获当年“技术突破奖”。
技能特长
沟通能力
执行能力
热情坦诚
文案能力
奖项荣誉
  • 数据库系统工程师(中级)
  • 2023年公司级数据仓库性能优化大赛二等奖
  • 2022年度部门优秀技术员工
自我评价
  • 深耕互联网数据仓库领域,擅长从用户行为、交易等业务链路拆解需求,将模糊业务目标转化为分层可扩展的数仓架构,支撑多场景分析。
  • 面对海量ETL瓶颈,习惯用“分层诊断+链路优化”思维,从数据倾斜到资源调度逐一突破,推动核心流程效率显著提升。
  • 主动联动业务与研发,以“业务语言+技术逻辑”双向翻译,推动指标体系标准化,减少跨团队沟通损耗。
  • 关注流批一体等行业趋势,将其融入现有架构,提前布局支持业务快速迭代,保持数仓对需求的敏捷响应。
报考信息
填写报考学校
填写报考专业
科目1
分数1
科目2
分数2
科目3
分数3
科目4
分数4
试一下,换个颜色
选择配色
使用此模板创建简历
  • 支持电脑端、微信小程序编辑简历
  • 支持一键更换模板,自由调整字距行距
  • 支持微信分享简历给好友查看
  • 支持简历封面、自荐信、自定义简历模块
  • 支持导出为PDF、图片、在线打印、云端保存
该简历模板已内置
  • 个人名称
  • 头像
  • 基本信息
  • 求职意向
  • 工作经历
  • 项目经验
  • 实习经验
  • 作品展示
  • 奖项荣誉
  • 校园经历
  • 教育背景
  • 兴趣爱好
  • 技能特长
  • 语言能力
  • 自我评价
  • 报考信息
  • 简历封面
  • 自荐信
对话框
提示
说明