当前模板已根据「数据仓库开发工程师」岗位深度优化
选择其他岗位
开始编辑模板后,您可以进一步自定义包括:工作履历、工作内容、信息模块、颜色配置等
内置经深度优化的履历,将为你撰写个人简历带来更多灵感。
陆明哲
责任心不是口号,而是渗透在每个工作细节中的行动准则。
28岁
3年工作经验
13800138000
DB@zjengine.com
陆明哲的照片
求职意向
数据仓库开发工程师
宁波
薪资面谈
一个月内到岗
工作经历
2022.06 - 2024.01
小楷智能科技有限公司
数据资产化专家
  • 为某大型零售集团客户构建了“数据资产化运营”体系,将沉睡的原始数据加工为“标准数据产品”(如行业分析报告、用户洞察包、销量预测模型)。通过设计数据产品目录、计价模型与开放平台,最终实现了数据的对外价值变现,年创造直接收入超五千万元。
  • 主导设计“数据资产价值度量”模型,创新性地从“成本、质量、应用热度、业务价值”四个维度对数据资产进行量化评估与排名,使数据管理从成本中心转变为价值中心,驱动业务部门优先使用高价值数据。
  • 独立打造“数据产品一键交付”流水线,实现了从数据加工、质量检测、安全脱敏到产品包生成的全程自动化,将一个新数据产品的上线周期从1个月缩短至1周。
  • 该项目成果被评为行业标杆案例,成功助力客户数字化转型,并获得了公司最高级别的“卓越贡献奖”。
2020.11 - 2022.05
小楷智能科技有限公司
数据仓库开发工程师
  • 深度参与多个客户的数据仓库项目,不仅负责技术实现,更主动深入业务,理解数据背后的商业逻辑,能够将模糊的业务需求转化为精准的数据模型。
  • 负责“金融风控数据主题”的建设,其设计的复杂指标加工模型,准确刻画了用户风险特征,成为风控规则的核心依据,坏账率降低2个百分点。
  • 沉淀了丰富的跨行业知识,并形成了自己的数据建模方法论,成为了团队中解决复杂业务数据问题的核心成员。
项目经验
2022.03 - 2023.08
星途互动科技有限公司
大数据开发负责人

星途直播平台实时用户行为分析系统重构与性能优化

  • 项目背景:直播业务进入精细化运营阶段,原有离线Hadoop MapReduce架构的实时用户行为分析系统存在严重延迟(平均2小时),无法支撑运营团队对直播间热度、礼物转化、用户流失的分钟级决策需求。核心目标是将系统升级为流批一体的实时数仓,将关键指标延迟降至10秒内,同时支撑日均1亿条用户行为数据的处理。我在项目中主导技术方案设计、跨部门需求对齐及全链路落地。
  • 关键难题:1)原有烟囱式架构导致数据重复计算,资源浪费率达40%;2)Kafka分区策略固定,高峰期单分区吞吐量超上限引发热点;3)实时聚合查询依赖全表扫描,95%的ad-hoc查询响应时间超过30秒;4)Flink任务频繁因状态过大导致Checkpoint失败,稳定性不足。
  • 核心行动与创新:1)架构升级:采用Kappa架构整合Flink 1.17做实时计算、Apache Hudi 0.12做实时数据湖存储,实现“实时写入-增量计算-实时查询”流批一体链路;2)Kafka优化:基于主播粉丝量、礼物热度的动态分区算法,将分区数从32个扩展至64个,并自定义分区器分散热点数据;3)查询加速:构建“Hudi实时表+Flink SQL预聚合+Apache Druid二级索引”的双层架构,预计算12个核心指标(如实时在线人数、礼物转化率),将查询响应时间压缩至5秒内;4)稳定性保障:引入Flink增量Checkpoint、状态TTL清理机制,结合YARN Capacity Scheduler做任务队列隔离,将任务失败率从8%降至0.5%。
  • 项目成果:1)实时数据延迟从2小时降至5秒内,95%指标延迟<10秒,支撑大促期间单日10万场直播的实时运营;2)系统吞吐量从每小时100万条提升至1.2亿条,资源成本下降35%;3)运营团队决策效率提升70%,活动期间礼物策略调整从小时级缩短至分钟级,带动直播间ARPU提升18%;4)主导输出《直播实时数仓技术规范》,成为公司同类项目的技术标准,个人晋升为大数据开发负责人。
2020.06 - 2022.02
星途互动科技有限公司
大数据开发工程师

电商用户生命周期数据中台建设

  • 项目背景:公司电商业务用户数据分散在CRM、订单、行为日志等10+系统,缺乏统一的用户标签体系和生命周期管理,精准营销转化率仅3%。核心目标是搭建用户生命周期数据中台,整合多源数据生成300+用户标签,支撑运营团队对“拉新-促活-留存-转化”全链路的精准触达。我在项目中负责数据采集、ETL整合、标签计算及平台对接。
  • 关键难题:1)多源数据schema不一致,比如CRM用户属性为MySQL宽表,订单数据为Oracle事务表,行为日志为JSON半结构化数据;2)标签计算时效性差,如“最近30天复购率”需T+1更新,无法支撑实时营销;3)标签准确性低,因缺乏一致性校验,部分标签错误率超20%;4)隐私数据安全风险,用户手机号、地址等信息未加密存储。
  • 核心行动与创新:1)数据整合:用Flume采集行为日志、Sqoop同步关系型数据库,通过Spark ETL清洗转换,建立统一用户宽表(包含用户ID、消费金额、浏览时长等50+字段),采用星型模型优化查询性能;2)标签体系设计:基于RFM模型(最近消费、消费频率、消费金额)和行为特征(收藏、加购、分享),开发批量标签(如“高价值用户”)与实时标签(如“最近7天登录用户”),用Flink实现标签分钟级更新;3)质量管控:引入数据校验规则引擎(Great Expectations),对标签字段做唯一性、完整性、一致性检查,将错误率降至3%以内;4)安全合规:用AES-256加密用户隐私字段,结合Apache Ranger做权限分级,实现“看数据不碰数据”的安全访问。
  • 项目成果:1)整合10+数据源的2PB用户数据,建立公司首个统一用户数据仓库;2)生成320个用户标签,标签准确率从70%提升至95%,覆盖90%的运营场景;3)精准营销转化率提升45%,营销成本下降28%,支撑“双11”期间新用户留存率提升20%;4)数据中台成为公司用户增长的核心引擎,支撑了“潜力用户运营”“高价值用户召回”等多个重点项目,个人获当年“技术突破奖”。
技能特长
沟通能力
执行能力
热情坦诚
文案能力
奖项荣誉
  • 计算机技术与软件专业技术资格(水平)证书(中级:数据库系统工程师)
  • 2022年度公司项目攻坚奖
  • 2023年公司优秀技术员工
自我评价
  • 互联网数据仓库实战专家,专注用分层架构串联业务数据,擅长将运营、用户行为需求转化为高复用数仓主题模型。
  • 解决问题先锚定业务价值,面对口径分歧或性能瓶颈,先对齐目标再推技术优化,拒绝无效投入。
  • 主动联动业务方建数据质量机制,从ETL到维度表维护都嵌校验,从源头保障数据可用。
  • 懂互联网增长逻辑,能预判数据需求,提前规划数仓扩展能力支撑新业务快速接入。
试一下,换个颜色
选择配色
使用此模板创建简历
  • 支持电脑端、微信小程序编辑简历
  • 支持一键更换模板,自由调整字距行距
  • 支持微信分享简历给好友查看
  • 支持简历封面、自荐信、自定义简历模块
  • 支持导出为PDF、图片、在线打印、云端保存
该简历模板已内置
  • 个人名称
  • 头像
  • 基本信息
  • 求职意向
  • 工作经历
  • 项目经验
  • 实习经验
  • 作品展示
  • 奖项荣誉
  • 校园经历
  • 教育背景
  • 兴趣爱好
  • 技能特长
  • 语言能力
  • 自我评价
  • 报考信息
  • 简历封面
  • 自荐信
对话框
提示
说明