当前模板已根据「数据仓库开发工程师」岗位深度优化
选择其他岗位
开始编辑模板后,您可以进一步自定义包括:工作履历、工作内容、信息模块、颜色配置等
内置经深度优化的履历,将为你撰写个人简历带来更多灵感。
陆明哲的照片
陆明哲
昨天的经验是今天的基石,而今天的突破将成为明天的标准。
28岁
3年工作经验
13800138000
DB@zjengine.com
求职意向
数据仓库开发工程师
宁波
薪资面谈
一周内到岗
工作经历
2022.07 - 2024.08
小楷同城生活服务有限公司
资深数据仓库开发工程师

负责同城生活服务平台全链路数据资产建设,覆盖用户行为、交易履约、商户运营三大核心域的数据整合与标准化,主导数据仓库分层架构优化及元数据管理体系落地,支撑营销、运营、风控等业务线的精准决策需求

  • 主导用户行为数据域重构项目,基于Kimball维度建模理论整合App埋点、小程序日志、第三方支付回调等多源数据,用Spark SQL完成日均15TB数据清洗关联,通过设计UUID+设备指纹联合标识体系解决跨端用户ID映射不一致问题,将用户行为数据可用率从78%提升至95%,支撑营销活动ROI分析效率提升40%
  • 核心参与数据仓库元数据管理平台搭建,选用Apache Atlas作为元数据采集引擎,结合自研标签体系实现表级、字段级元数据自动化同步与血缘追踪,解决原元数据分散在ETL脚本中查找困难的问题,元数据查询耗时从平均30分钟缩短至5分钟内,业务线数据需求响应速度提升50%
  • 重点优化交易履约数据仓库分层逻辑,将原有ODS-DWD-DWS三层扩展为含ADS的四层体系,引入Hudi增量更新替代传统T+1全量同步,把订单履约数据产出时效从次日8点提前至当日12点,满足风控团队实时交易风险预警需求,风险识别准确率提升25%
  • 负责商户运营数据集市开发,基于维度建模设计商户生命周期、经营能力、用户评价三大主题模型,用ClickHouse存储聚合指标,支持运营团队快速查询“近30天活跃商户指标变化”“高客单价商户用户画像分布”等问题,日均查询次数从120次提升至800次,运营决策精准度提升30%
2020.06 - 2022.06
小楷生活科技数据有限公司
数据仓库开发工程师

负责生活服务类平台交易与商户数据的数据仓库建设,聚焦多源数据整合、标准化及基础主题模型开发,支撑运营与产品团队日常分析需求,同时参与数据质量体系初步搭建

  • 主导交易数据域整合项目,处理美团、饿了么第三方订单(用Sqoop增量同步)及自有平台订单,通过设计统一订单维度表(含订单ID、用户ID等核心维度)解决多源结构不一致问题,日均处理8TB订单数据,数据一致性从85%提升至98%
  • 核心参与商户数据主题模型开发,基于星型模型设计商户基础信息、经营指标、用户评价三大主题,用Hive SQL计算月均订单量、好评率等指标并存储至HBase,解决原商户数据分散在Excel的问题,运营团队获取数据时间从1天缩短至10分钟内
  • 负责数据质量体系初步搭建,设计订单金额非空、用户ID格式正确等校验规则,用DataWorks数据质量模块实现自动化校验,每天拦截1.2万条异常数据,数据质量问题投诉率从每周5次降至每周1次以内
  • 支撑营销活动数据分析,开发“活动参与用户画像”“转化漏斗”等指标并用Tableau可视化,帮助营销团队优化策略,某次满减活动转化率提升18%、参与用户数增长25%
2018.03 - 2020.05
小楷网络科技有限公司
初级数据仓库开发工程师

协助数据仓库基础建设,负责数据抽取、清洗及简单主题模型开发,参与数据文档编写维护,保障数据仓库稳定运行

  • 协助完成ODS层基础数据抽取,用Sqoop从MySQL同步用户、商户、商品数据,日均同步1TB,通过编写Shell脚本实现任务定时执行与错误告警,任务成功率从90%提升至99%
  • 负责简单数据清洗,用Hive ROW_NUMBER()函数去重用户表重复数据、通过均值填充补全缺失数据,清洗后数据可用率达95%以上,支撑后续DWD层开发
  • 开发用户行为简单主题模型,用Hive SQL计算日活用户数、用户停留时长等指标并存储至MySQL,帮助产品团队了解用户基础行为特征
  • 参与数据文档编写维护,整理《ODS层数据字典》《简单指标计算逻辑》等文档,覆盖100+张表和50+个指标,新员工熟悉数据仓库时间缩短30%
项目经验
2022.03 - 2023.08
星途数字科技有限公司
大数据开发工程师(实时计算方向)

电商大促场景下实时用户行为分析平台研发

  • 项目背景:公司核心电商平台在大促期间面临用户行为数据峰值达12万/秒的冲击,原有离线分析系统延迟超40分钟,无法支撑运营团队对爆款商品调整、用户转化链路优化的实时决策需求。我的核心目标是主导构建一套低延迟(≤15秒)、高并发(支持峰值15万/秒事件)、高准确的实时用户行为分析平台,覆盖实时用户画像、转化漏斗追踪、爆款商品热度预测三大核心场景。
  • 关键难题与技术:1. 海量数据实时摄入的稳定性——高峰期Kafka集群常因分片不均出现消息堆积;2. 跨设备用户行为链的关联计算——用户通过APP、小程序、H5多端访问时,传统session划分无法准确还原行为路径;3. 多维度标签的实时更新——用户兴趣标签需随浏览、加购、下单行为即时调整,原有批量更新方式导致标签滞后2小时。
  • 核心行动与创新:1. 架构设计上采用“分层解耦+弹性扩缩”模式:数据摄入层用Kafka集群按事件类型分片(如行为事件、交易事件分开),计算层用Flink动态资源调度(根据消息堆积量自动增减TaskManager),存储层用HBase预分区+Redis缓存热点数据(如TOP100爆款商品的实时点击量);2. 针对跨设备行为关联,自研基于“设备指纹+用户ID映射表”的事件关联算法,用Flink ProcessFunction实现滑动时间窗口(1小时)内的行为链拼接,引入布隆过滤器过滤无效设备匹配;3. 实时标签引擎采用Flink状态管理(ValueState存储用户行为序列),结合Drools规则引擎配置标签触发条件(如“30分钟内浏览3个母婴商品→标记为母婴兴趣用户”)。
  • 项目成果:1. 数据端到端延迟从40分钟降至8秒内,大促期间支撑16万/秒事件处理,系统稳定性达99.99%;2. 运营团队实时决策效率提升50%,如爆款商品库存调整时间从1小时缩短至8分钟,大促期间TOP10商品的销售转化率较去年同期提升18%;3. 平台复用至公司旗下3个电商子品牌,累计节省实时计算成本约30%。我个人主导了平台架构设计与核心模块开发,解决了实时性与跨端行为关联的关键技术瓶颈。
2020.07 - 2022.02
星途数字科技有限公司
大数据开发工程师(数据平台方向)

内容社区用户兴趣图谱数据层构建与优化

  • 项目背景:公司内容社区推荐系统依赖用户兴趣图谱,但原有数据分散在MySQL(用户属性)、Hive(行为日志)、Neo4j(社交关系)三个库中,需人工整合且更新频率低(每天一次),导致推荐准确率仅2.1%(点击率)。我的目标是整合多源数据,构建统一的用户兴趣图谱数据层,支撑推荐系统实时更新用户兴趣标签与内容关联关系。
  • 关键难题与技术:1. 多源数据的语义融合——用户行为日志中的“点击”与内容元数据中的“分类”需建立统一本体模型;2. 图数据的增量更新效率——原有全量更新需6小时,无法满足推荐系统实时性需求;3. 图查询的性能瓶颈——用户相似度查询需遍历10层以上邻居节点,响应时间超500ms。
  • 核心行动与创新:1. 设计“统一兴趣本体模型”,定义“用户-行为-内容-标签”四类实体及12种关系(如“用户-浏览-内容”“内容-属于-标签”),用Spark SQL完成多源数据的ETL映射,将分散数据统一存储至Neo4j图数据库;2. 实现实时增量更新机制:用Canal捕获MySQL用户行为日志的binlog,通过Spark Streaming过滤有效行为(如浏览≥5秒、点赞),再调用Neo4j的REST API更新节点属性(如用户兴趣标签权重)与边关系(如用户-点击-内容的边权重+0.1);3. 优化查询性能:为高频查询字段(如用户ID、标签ID)创建Lucene索引,引入Redis缓存TOP1000用户的高频相似度查询结果(过期时间5分钟)。
  • 项目成果:1. 兴趣图谱数据更新频率从每天一次提升至每10分钟一次,数据一致性从85%提升至99%;2. 推荐系统点击率从2.1%升至2.6%(提升23.8%),用户日均停留时长增加12分钟;3. 数据层支撑了社区90%的推荐场景(如首页信息流、详情页相关推荐)。我个人主导了数据层架构设计与增量更新机制,解决了多源数据融合与实时性难题,为推荐系统的效果提升奠定了基础。
技能特长
沟通能力
执行能力
热情坦诚
文案能力
奖项荣誉
  • 数据库系统工程师(中级)
  • 2022年度公司项目攻坚奖
  • 2023年部门数据仓库项目突出贡献奖
自我评价
  • 深耕互联网数据仓库,以业务价值为核心搭底层架构——既用维度建模支撑运营、用户场景快速取数,也预判业务增长做分层解耦。
  • 从数据全生命周期抓质量,不仅埋点ETL校验规则,更联动业务梳理指标口径,把“准确”变可落地机制。
  • 对查询性能有极致敏感,从执行计划反推优化点,更沉淀可复用checklist避免重复踩坑。
  • 跨团队用双方语言桥接——和产品聊需求会问“指标未来扩展吗”,和技术讲场景痛点,拒绝无效做数据。
试一下,换个颜色
选择配色
使用此模板创建简历
  • 支持电脑端、微信小程序编辑简历
  • 支持一键更换模板,自由调整字距行距
  • 支持微信分享简历给好友查看
  • 支持简历封面、自荐信、自定义简历模块
  • 支持导出为PDF、图片、在线打印、云端保存
该简历模板已内置
  • 个人名称
  • 头像
  • 基本信息
  • 求职意向
  • 工作经历
  • 项目经验
  • 实习经验
  • 作品展示
  • 奖项荣誉
  • 校园经历
  • 教育背景
  • 兴趣爱好
  • 技能特长
  • 语言能力
  • 自我评价
  • 报考信息
  • 简历封面
  • 自荐信
对话框
提示
说明