当前模板已根据「实时计算开发工程师」岗位深度优化
选择其他岗位
开始编辑模板后,您可以进一步自定义包括:工作履历、工作内容、信息模块、颜色配置等
内置经深度优化的履历,将为你撰写个人简历带来更多灵感。
陆明哲的照片
陆明哲
在平凡的岗位上创造不平凡的价值,这是我的职业信仰。
28岁
3年工作经验
13800138000
DB@zjengine.com
求职意向
实时计算开发工程师
杭州
薪资面谈
随时到岗
工作经历
2021.12 - 2023.07
小楷智能数据科技公司
流批一体架构师
  • 主导公司“流批一体数据融合”战略的落地,基于Apache Flink和Apache Hudi构建了统一的数据处理架构。通过一套代码(Flink DataStream API)同时处理实时流和离线批量历史数据,并将结果写入Hudi表,彻底消除了实时与离线数据之间的口径不一致问题,数据一致性达到100%。
  • 创新的“增量物化视图”方案,基于Flink的持续查询能力,将传统需要定期全量计算的数据模型转变为“实时增量更新”模式,将核心业务数据的产出延迟从小时级降至秒级,同时计算资源消耗降低50%。
  • 该方案成功帮助某大型制造企业客户实现了对其全产业链数据的实时监控与决策,客户库存周转率因此提升15%,该项目成为公司年度标杆案例,带来合同金额超两千万元。
  • 在公司内向业务部门大力推广Flink CDC技术,替代了传统的基于查询的数据库同步方案,实现了数据库增量变化的低延迟、全量同步,将数据实时入湖入仓的效率提升了一个数量级。
2020.03 - 2021.11
小楷智能数据科技公司
ETL开发工程师
  • 负责传统的离线数据仓库开发,使用 Hive 和 Spark 处理每日 TB级 的业务数据,对数据建模和离线ETL有深入理解。
  • 主导设计云原生实时数据平台​​,基于​​Flink on Kubernetes​​构建,实现了计算资源的秒级弹性伸缩,成功应对了业务流量高达​​10倍​​的瞬时波峰,年度计算成本优化​​25%​​。
  • 深度优化​​Flink State​​的存取效率,针对超大规模状态(​​TB级​​)作业,创新性地采用​​SSD+内存​​的混合存储模式,并将checkpoint时间稳定在​​90秒​​ 以内,平台稳定性大幅提升。
  • 构建了​​实时数据血缘与治理体系​​,实现了从Kafka Topic到Flink作业再到下游应用的端到端血缘追踪,数据故障定位平均时间从小时级缩短至​​5分钟​​。
项目经验
2022.03 - 2023.08
星途互动科技有限公司
大数据开发负责人

用户行为实时分析平台与个性化推荐引擎升级项目

  • 星途互动作为聚焦Z世代的内容社交平台,MAU突破5000万时遇到增长瓶颈——现有实时数仓因数据倾斜、Checkpoint不稳定导致特征延迟超5秒,推荐模型AUC仅0.72,无法支撑“千人千面”的个性化体验需求。我作为大数据开发负责人,主导全链路实时数据处理与推荐特征优化项目,目标是将实时数仓端到端延迟压至1秒内,推动推荐模型准确性提升。
  • 项目面临两大核心挑战:一是用户行为事件流因头部用户占比20%却产生80%事件导致KeyedStream状态爆炸,Flink作业Checkpoint失败率达15%;二是实时特征依赖离线ETL同步,滞后30分钟,无法捕捉用户即时兴趣变化。针对数据倾斜,我通过Flink动态分区策略,基于用户活跃度实时调整Key分组权重,将大Key拆分为多个子Key并行处理;针对特征滞后,设计“流批一体实时特征工厂”,用Flink SQL结合Redis Stream实现特征秒级更新,同时通过窗口一致性校验保证数据准确性。
  • 我主导重构了实时数仓分层架构,将原有单一ODS-DWD-DWS调整为“原始层-缓冲层-聚合层-特征层”:缓冲层引入Kafka分层Topic机制,隔离高并发写入与低延迟处理;特征层创新设计“基于事件时间的滑动窗口兴趣衰减向量”,融合用户最近10分钟的行为序列(点击、点赞、评论),赋予近期行为更高权重,更精准反映用户即时偏好。同时推动跨团队对齐特征规范,确保实时特征与算法模型的无缝对接。
  • 项目上线后,实时数仓端到端延迟从5.2秒降至0.8秒,推荐模型AUC提升至0.84,平台CTR较之前增长11.3%,日均支撑35亿条用户行为数据的实时处理。我主导的动态分区策略与特征工厂方案被纳入公司大数据开发规范,成为后续实时数仓项目的标准架构,我个人也因此晋升为大数据架构师。
2020.10 - 2022.02
星途互动科技有限公司
高级大数据开发工程师

企业级大数据平台数据资产化管理与成本管控项目

  • 随着平台数据量年增长80%,大数据平台存储成本占比达研发预算的30%,且存在大量重复日志、无效用户行为数据,数据查找耗时平均1小时以上,业务团队常因“找不到数据”“数据不准”延误项目。我作为高级大数据开发工程师,主导数据资产化管理与成本管控项目,目标是建立全链路数据资产目录,将存储成本降低30%,提升数据复用率。
  • 项目核心痛点在于:一是缺乏统一元数据管理,数据来源分散在业务库、日志采集、第三方接口,无法快速定位可用数据;二是冷热数据未分层,所有数据均存放在SSD上,成本高且利用率低。我采用Apache Atlas搭建元数据管理系统,通过自定义采集器同步Flink、Hive、ClickHouse的元数据,给每条数据打“业务域”“数据类型”“更新频率”“热度”四大标签;同时设计“动态存储策略引擎”,基于标签自动将数据迁移至对应存储介质——热数据(日查询≥10次)存SSD保留7天,温数据(周查询≥1次)存HDFS保留30天,冷数据(月查询≤1次)存OSS长期归档。
  • 我主导制定了《星途数据资产分类标准》,将数据分为用户行为、内容元数据、业务流程三大类,每类定义统一命名规范与字段标准;创新实现“数据热度实时监控”,通过Flink实时统计数据的查询次数与访问时长,每10分钟更新一次热度标签,触发存储迁移。同时推动建立“数据Owner”制度,明确各部门数据维护责任,从源头减少无效数据产生。
  • 项目完成后,平台存储成本较之前降低38%,数据查找时间缩短至8分钟内,数据复用率从22%提升至65%。元数据管理系统覆盖了95%以上的业务数据,彻底解决了“找数据难”的问题。该项目的成本管控方案被集团其他3条业务线复用,我个人也因此积累了从技术执行到数据治理的全流程经验。
技能特长
沟通能力
执行能力
热情坦诚
文案能力
奖项荣誉
  • 中级软件设计师
  • 2023年度公司项目攻坚奖
  • 2024年公司优秀技术员工
自我评价
  • 深耕互联网实时计算赛道,擅长将业务需求转化为低延迟、高并发的实时数据处理链路,聚焦架构设计及性能优化。
  • 对Flink等引擎底层机制有深度理解,习惯从状态管理、故障恢复维度系统性解决稳定性与延迟痛点。
  • 以业务价值为核心,主动联动产品拆解实时指标需求,推动计算结果直接支撑推荐、风控等关键场景决策。
  • 技术敏感度强,持续跟踪新框架并快速验证适配性,始终保持对实时计算前沿方向的敏锐洞察。
试一下,换个颜色
选择配色
使用此模板创建简历
  • 支持电脑端、微信小程序编辑简历
  • 支持一键更换模板,自由调整字距行距
  • 支持微信分享简历给好友查看
  • 支持简历封面、自荐信、自定义简历模块
  • 支持导出为PDF、图片、在线打印、云端保存
该简历模板已内置
  • 个人名称
  • 头像
  • 基本信息
  • 求职意向
  • 工作经历
  • 项目经验
  • 实习经验
  • 作品展示
  • 奖项荣誉
  • 校园经历
  • 教育背景
  • 兴趣爱好
  • 技能特长
  • 语言能力
  • 自我评价
  • 报考信息
  • 简历封面
  • 自荐信
对话框
提示
说明