当前模板已根据「数据平台开发工程师」岗位深度优化
选择其他岗位
开始编辑模板后,您可以进一步自定义包括:工作履历、工作内容、信息模块、颜色配置等
内置经深度优化的履历,将为你撰写个人简历带来更多灵感。
陆明哲
在平凡的岗位上创造不平凡的价值,这是我的职业信仰。
28岁
3年工作经验
13800138000
DB@zjengine.com
陆明哲的照片
求职意向
数据平台开发工程师
苏州
薪资面谈
三个月内到岗
工作经历
2023.07 - 至今
小楷电商科技
高级数据平台开发工程师

负责公司云原生大数据平台的架构升级、核心组件开发及全链路性能优化,支撑广告投放、用户增长、供应链决策等多业务线的高并发数据处理与实时分析需求,覆盖数据接入、存储计算、元数据管理及跨平台协同全生命周期。

  • 主导设计并落地基于云原生架构的新一代数据平台,采用Kubernetes进行资源弹性编排,结合Alluxio构建跨可用区缓存层,解决原有Hadoop集群资源利用率低(不足40%)、跨集群计算延迟高的痛点。通过动态资源调度策略(基于YARN Capacity Scheduler扩展)与计算任务分片优化,平台日均处理数据量从500TB提升至1.2PB,任务平均执行耗时下降40%,集群成本降低25%。
  • 核心开发实时数据接入网关系统,基于Flink SQL与自定义状态管理算子,支持日志(APP/Web)、埋点、业务DB(MySQL/PostgreSQL)等多源数据的统一接入与Schema动态校验。集成Prometheus+Grafana构建监控看板,实现接入延迟(P99<50ms)、数据丢失率(<0.001%)、背压率(<5%)的实时预警。上线后支撑双11大促期间单日200亿+事件数据的稳定处理,未发生数据积压或错漏。
  • 重构元数据管理系统,基于Apache Atlas扩展自定义标签体系(含“数据敏感等级”“业务归属线”“计算成本标签”),结合Apache Ranger实现字段级权限控制。通过优化图数据库查询索引与血缘解析算法,元数据查询响应时间从秒级缩短至200ms内,支撑数据治理团队完成全平台80%数据的血缘梳理与GDPR合规审计,数据问题定位效率提升70%。
  • 推动数据平台与机器学习平台深度集成,开发特征工程组件库(支持Spark MLlib、TensorFlow双引擎),封装用户行为序列特征(如30天点击频次)、时序统计特征(如7日GMV波动)等20+通用模板。通过标准化输入输出接口与缓存机制,算法团队特征开发周期从3天缩短至6小时,模型A/B测试迭代效率提升60%。
2020.06 - 2023.06
小楷零售科技
数据平台开发工程师

参与公司大数据平台的基础组件开发与稳定性建设,聚焦离线数仓、实时计算、数据质量三大核心模块,保障广告效果分析、库存周转预测等业务场景的可靠运行,支撑日均千万级数据处理需求。

  • 负责离线数据仓库ETL流程优化,基于Hive 3.x与Tez引擎重构核心用户宽表计算逻辑。通过分区裁剪(按周分区替代月分区)、谓词下推(将过滤条件前置到扫描层)、向量化执行(开启Hive Vectorization)等手段,将每日千万级数据量的ETL任务耗时从8小时缩短至3小时,集群CPU利用率从30%提升至55%,资源消耗降低35%。
  • 主导开发数据质量监控系统,集成Apache Sqoop与自研校验规则引擎(支持SQL/UDF自定义规则),实现字段级(空值率、唯一性、值域范围)与表级(数据量波动阈值、跨表关联一致性)的自动化监控。设置100+核心指标监控规则,将数据质量问题发现时效从T+1缩短至5分钟内,线上数据错误率从0.8%降至0.12%,支撑财务结算与运营报表零重大事故。
  • 参与实时计算平台(基于Flink 1.13)的任务调度优化,设计基于负载预测的动态扩缩容策略(结合Prometheus指标与线性回归模型)。通过YARN队列优先级调整与TaskManager内存复用,大促期间实时任务资源利用率从50%提升至75%,任务延迟超标率(P95>1s)从15%降至3%,保障了大促期间实时GMV、用户转化等指标的秒级更新。
  • 协助搭建数据湖(Delta Lake)存储层,替代传统HDFS存储结构化日志与埋点数据。通过ACID事务支持与多引擎(Spark、Presto)兼容特性,解决小文件合并与版本回溯痛点,数据湖查询性能提升40%,支撑数据分析团队实现更灵活的即席查询(如按商品品类+地域的多维聚合分析)。
2018.03 - 2020.05
小楷生活服务
大数据开发工程师

参与公司大数据基础平台建设,负责数据采集、存储与初步加工,支撑运营报表、用户画像分析等基础数据需求,覆盖日志、业务库、第三方数据等多源接入场景。

  • 开发多源数据采集管道,使用Flume(日志采集)与自定义Kafka生产者(业务DB binlog同步),实现用户行为日志(APP/Web)、订单数据(MySQL)的增量同步。通过断点续传(记录offset到Redis)与数据去重(基于Bloom Filter),数据采集完整性达99.99%,端到端延迟控制在1分钟内,支撑运营团队实时查看服务响应率与用户投诉趋势。
  • 优化Hive数仓分层结构,设计ODS(原始数据)->DWD(明细数据)->DWS(汇总数据)三级模型,定义200+公共维度(如用户、地区、时间)与指标(如DAU、订单转化率)。通过统一维度表命名规范与指标计算逻辑,跨部门数据协作效率提升50%,业务报表产出时间从T+2提前至T+1,支撑市场部日报与周报的准时发布。
  • 支撑用户增长团队的精准营销需求,基于HBase与Redis构建实时标签存储系统。开发标签计算脚本(Shell+Python),实现用户活跃度(7日登录次数)、消费偏好(高频购买品类)等50+标签的每日更新。标签准确率达92%,助力运营团队定向推送优惠券,活动ROI从1:3.2提升至1:4.1。
  • 解决HDFS小文件过多问题,编写自动化合并脚本(基于Hadoop Archive),将单目录下小文件数量从10万+压缩至500以内,NameNode内存占用降低60%,Hive查询任务失败率从8%降至1%,保障了日常数据提取与分析的稳定性。
实习经验
2019.11 - 2020.04
小楷网络
产品设计实习生
  • 用户体验重构:主导后台管理系统信息架构改版,通过用户任务流分析将核心操作路径缩短3步,客户培训成本下降50%;
  • 数据驱动设计:对200+条用户反馈聚类分析,建立“高频痛点优先级矩阵”,推动4项优化需求进入开发(上线后NPS提升22分);
  • 跨部门协同:协调研发团队落地设计规范组件库,缩短产品迭代周期30%,获季度“最佳流程优化奖”。
技能特长
沟通能力
执行能力
热情坦诚
文案能力
奖项荣誉
  • 软件设计师
  • 2023年度公司项目攻坚奖
  • 2024年优秀技术员工
自我评价
  • 聚焦互联网数据平台底层能力建设,以工程思维锚定数据链路性能与稳定性风险,将业务需求转化为可落地架构。
  • 深知数据平台是业务决策的“基建底座”,始终以降低取数成本、提升数据可信度驱动功能迭代。
  • 习惯主动排查平台隐性痛点——从日志异常到跨系统一致性,闭环跟进推动根因解决,不被动响应。
  • 擅长与业务、算法、运维对齐技术语言,将数据平台技术价值转化为各角色可感知的业务价值。
试一下,换个颜色
选择配色
使用此模板创建简历
  • 支持电脑端、微信小程序编辑简历
  • 支持一键更换模板,自由调整字距行距
  • 支持微信分享简历给好友查看
  • 支持简历封面、自荐信、自定义简历模块
  • 支持导出为PDF、图片、在线打印、云端保存
该简历模板已内置
  • 个人名称
  • 头像
  • 基本信息
  • 求职意向
  • 工作经历
  • 项目经验
  • 实习经验
  • 作品展示
  • 奖项荣誉
  • 校园经历
  • 教育背景
  • 兴趣爱好
  • 技能特长
  • 语言能力
  • 自我评价
  • 报考信息
  • 简历封面
  • 自荐信
对话框
提示
说明