当前模板已根据「数据仓库开发工程师」岗位深度优化
选择其他岗位
开始编辑模板后,您可以进一步自定义包括:工作履历、工作内容、信息模块、颜色配置等
内置经深度优化的履历,将为你撰写个人简历带来更多灵感。
陆明哲
在平凡的岗位上创造不平凡的价值,这是我的职业信仰。
28岁
3年工作经验
13800138000
DB@zjengine.com
陆明哲的照片
求职意向
数据仓库开发工程师
宁波
薪资面谈
一周内到岗
工作经历
2022.05 - 2023.12
小楷智能科技有限公司
数据治理专家
  • 为某大型金融客户主导设计了“企业级数据治理”落地解决方案,涵盖“数据标准、元数据、数据质量、数据安全”四大核心领域。通过推动制定300+项数据标准和质量规则,并实现自动化稽核,使客户的数据质量得分从70分提升至95分,顺利通过监管审计。
  • 研发了“智能数据血缘分析”系统,通过解析SQL日志和ETL脚本,自动构建了从数据源到报表的端到端血缘图谱,实现了影响分析的“分钟级”响应,在数次重大变更中准确评估了影响范围,避免了线上事故。
  • 创新设计“数据安全分级分类与脱敏”方案,基于自然语言处理技术自动识别敏感数据,并实施动态脱敏策略,在保障数据安全的前提下,支持了数据分析师的安全数据使用。
  • 该项目成为公司的标杆案例,成功复制到多个行业客户,年创造咨询与产品收入超两百万元。
2020.10 - 2022.04
小楷智能科技有限公司
数据开发工程师
  • 负责多个客户项目的“数据仓库实施”工作,独立完成了从业务调研、模型设计、ETL开发到数据应用的全流程交付,深受客户好评。
  • 在项目中积极推行“数据质量卡点”,将质量检查嵌入数据处理流程,确保了交付数据的准确性。
  • 沉淀了丰富的行业数据模型经验,为公司的“零售行业数据模型”产品化贡献了核心设计。
项目经验
2022.03 - 2023.08
星途数字科技有限公司
大数据开发工程师(实时计算方向)

电商大促场景下实时用户行为分析平台研发

  • 项目背景:公司核心电商平台在大促期间面临用户行为数据峰值达12万/秒的冲击,原有离线分析系统延迟超40分钟,无法支撑运营团队对爆款商品调整、用户转化链路优化的实时决策需求。我的核心目标是主导构建一套低延迟(≤15秒)、高并发(支持峰值15万/秒事件)、高准确的实时用户行为分析平台,覆盖实时用户画像、转化漏斗追踪、爆款商品热度预测三大核心场景。
  • 关键难题与技术:1. 海量数据实时摄入的稳定性——高峰期Kafka集群常因分片不均出现消息堆积;2. 跨设备用户行为链的关联计算——用户通过APP、小程序、H5多端访问时,传统session划分无法准确还原行为路径;3. 多维度标签的实时更新——用户兴趣标签需随浏览、加购、下单行为即时调整,原有批量更新方式导致标签滞后2小时。
  • 核心行动与创新:1. 架构设计上采用“分层解耦+弹性扩缩”模式:数据摄入层用Kafka集群按事件类型分片(如行为事件、交易事件分开),计算层用Flink动态资源调度(根据消息堆积量自动增减TaskManager),存储层用HBase预分区+Redis缓存热点数据(如TOP100爆款商品的实时点击量);2. 针对跨设备行为关联,自研基于“设备指纹+用户ID映射表”的事件关联算法,用Flink ProcessFunction实现滑动时间窗口(1小时)内的行为链拼接,引入布隆过滤器过滤无效设备匹配;3. 实时标签引擎采用Flink状态管理(ValueState存储用户行为序列),结合Drools规则引擎配置标签触发条件(如“30分钟内浏览3个母婴商品→标记为母婴兴趣用户”)。
  • 项目成果:1. 数据端到端延迟从40分钟降至8秒内,大促期间支撑16万/秒事件处理,系统稳定性达99.99%;2. 运营团队实时决策效率提升50%,如爆款商品库存调整时间从1小时缩短至8分钟,大促期间TOP10商品的销售转化率较去年同期提升18%;3. 平台复用至公司旗下3个电商子品牌,累计节省实时计算成本约30%。我个人主导了平台架构设计与核心模块开发,解决了实时性与跨端行为关联的关键技术瓶颈。
2020.07 - 2022.02
星途数字科技有限公司
大数据开发工程师(数据平台方向)

内容社区用户兴趣图谱数据层构建与优化

  • 项目背景:公司内容社区推荐系统依赖用户兴趣图谱,但原有数据分散在MySQL(用户属性)、Hive(行为日志)、Neo4j(社交关系)三个库中,需人工整合且更新频率低(每天一次),导致推荐准确率仅2.1%(点击率)。我的目标是整合多源数据,构建统一的用户兴趣图谱数据层,支撑推荐系统实时更新用户兴趣标签与内容关联关系。
  • 关键难题与技术:1. 多源数据的语义融合——用户行为日志中的“点击”与内容元数据中的“分类”需建立统一本体模型;2. 图数据的增量更新效率——原有全量更新需6小时,无法满足推荐系统实时性需求;3. 图查询的性能瓶颈——用户相似度查询需遍历10层以上邻居节点,响应时间超500ms。
  • 核心行动与创新:1. 设计“统一兴趣本体模型”,定义“用户-行为-内容-标签”四类实体及12种关系(如“用户-浏览-内容”“内容-属于-标签”),用Spark SQL完成多源数据的ETL映射,将分散数据统一存储至Neo4j图数据库;2. 实现实时增量更新机制:用Canal捕获MySQL用户行为日志的binlog,通过Spark Streaming过滤有效行为(如浏览≥5秒、点赞),再调用Neo4j的REST API更新节点属性(如用户兴趣标签权重)与边关系(如用户-点击-内容的边权重+0.1);3. 优化查询性能:为高频查询字段(如用户ID、标签ID)创建Lucene索引,引入Redis缓存TOP1000用户的高频相似度查询结果(过期时间5分钟)。
  • 项目成果:1. 兴趣图谱数据更新频率从每天一次提升至每10分钟一次,数据一致性从85%提升至99%;2. 推荐系统点击率从2.1%升至2.6%(提升23.8%),用户日均停留时长增加12分钟;3. 数据层支撑了社区90%的推荐场景(如首页信息流、详情页相关推荐)。我个人主导了数据层架构设计与增量更新机制,解决了多源数据融合与实时性难题,为推荐系统的效果提升奠定了基础。
技能特长
沟通能力
执行能力
热情坦诚
文案能力
奖项荣誉
  • 数据库系统工程师(中级)
  • 2022年度公司项目攻坚奖
  • 2023年部门数据仓库项目突出贡献奖
自我评价
  • 互联网数据仓库实战专家,专注用分层架构串联业务数据,擅长将运营、用户行为需求转化为高复用数仓主题模型。
  • 解决问题先锚定业务价值,面对口径分歧或性能瓶颈,先对齐目标再推技术优化,拒绝无效投入。
  • 主动联动业务方建数据质量机制,从ETL到维度表维护都嵌校验,从源头保障数据可用。
  • 懂互联网增长逻辑,能预判数据需求,提前规划数仓扩展能力支撑新业务快速接入。
试一下,换个颜色
选择配色
使用此模板创建简历
  • 支持电脑端、微信小程序编辑简历
  • 支持一键更换模板,自由调整字距行距
  • 支持微信分享简历给好友查看
  • 支持简历封面、自荐信、自定义简历模块
  • 支持导出为PDF、图片、在线打印、云端保存
该简历模板已内置
  • 个人名称
  • 头像
  • 基本信息
  • 求职意向
  • 工作经历
  • 项目经验
  • 实习经验
  • 作品展示
  • 奖项荣誉
  • 校园经历
  • 教育背景
  • 兴趣爱好
  • 技能特长
  • 语言能力
  • 自我评价
  • 报考信息
  • 简历封面
  • 自荐信
对话框
提示
说明