当前模板已根据「DevOps工程师」岗位深度优化
选择其他岗位
开始编辑模板后,您可以进一步自定义包括:工作履历、工作内容、信息模块、颜色配置等
内置经深度优化的履历,将为你撰写个人简历带来更多灵感。
陆明哲
用系统化的思维解决问题,用温度化的方式交付成果,这是我的工作准则。
28岁
3年工作经验
13800138000
DB@zjengine.com
陆明哲的照片
求职意向
DevOps工程师
宁波
薪资面谈
三个月内到岗
工作经历
2022.06 - 2023.12
小楷云计算科技有限公司
DevOps产品研发专家
  • 作为核心研发,参与公司“DevOps平台即服务”产品的开发。该产品基于GitOps(ArgoCD)理念构建,为上千家外部企业客户提供“应用交付与持续部署”能力。通过设计“多集群、多环境一键发布与回滚”功能,其稳定性和易用性,成为产品的核心卖点,年创造收入超百万元。
  • 攻克了“大规模GitOps部署同步”的性能与稳定性瓶颈,通过优化ArgoCD Application Controller的事件处理机制和引入分页查询,使单集群可稳定管理上万个应用,同步延迟降低60%。
  • 开发“配置漂移检测与自动纠正”模块,能够持续比对集群实际状态与Git库中的声明式配置,发现并自动修复人为误操作导致的配置变更,保障了客户生产环境的“不可变性”与合规性。
  • 将“可观测性”深度融入交付流程,应用部署后自动为其创建Grafana监控大盘和告警规则,实现了部署即监控,帮助客户快速定位上线后的问题。
2020.11 - 2022.05
小楷云计算科技有限公司
工具链开发工程师
  • 负责公司内部“制品库管理”系统的开发和维护,统一管理了Docker镜像、Helm Chart、NPM包等所有二进制依赖,通过生命周期管理和垃圾清理策略,节省了30%的存储空间。
  • 独立研发实现了“CI/CD流水线模板化与标准化”,提炼了各技术栈的最佳实践,新项目接入DevOps体系的效率提升80%。
  • 积极贡献开源社区,向Argo CD等项目提交了若干Bug Fix和微小功能改进。
项目经验
2022.03 - 2023.10
星途互动科技有限公司
运维开发工程师(资深)

分布式链路追踪系统深度优化与全链路成本管控项目

  • 项目背景:随着公司直播电商业务日活突破500万,原有基于Elasticsearch的链路追踪系统出现严重性能瓶颈——全链路查询延迟超8秒,月存储成本高达120万元,且因数据冗余导致故障定位成功率仅65%。我的核心目标是重构系统性能底座,建立科学的数据生命周期管理机制,支撑业务侧“秒级排障”的需求。
  • 关键难题与技术:1)原有ES集群因无序写入和索引膨胀导致查询慢,传统分库分表无法解决海量时序数据的检索效率问题;2)数据保留策略一刀切(全存30天),无效数据占比达40%;3)多业务线标签体系混乱(如“用户ID”“商品ID”命名不统一),导致过滤条件命中率低。我选择ClickHouse作为冷热数据存储引擎(适配链路数据的列式存储与批量查询特性),结合Flink实现实时数据路由,同时引入“业务优先级+流量特征”的动态标签标准化方案。
  • 核心行动与创新:1)主导设计“热数据(7天)存ClickHouse、冷数据(30天+)存OSS”的分层架构,用Flink根据请求频率(QPS≥1000的接口)和错误率(≥5%的链路)自动打标,将高价值数据留存热层,低价值数据归档冷层;2)优化ClickHouse索引策略,针对“traceID”“serviceName”“userId”等高频查询字段建立跳数索引,同时合并冗余的tag字段(如将“appVersion”“clientId”整合为“clientInfo”复合标签);3)推动研发侧统一标签规范,新增“businessPriority”(业务优先级)标签,支持动态过滤低优先级链路(如测试环境的灰度请求)。
  • 项目成果与价值:1)链路查询延迟从8秒降至1.2秒,故障定位成功率提升至92%;2)月存储成本从120万元降至42万元(降低65%);3)支撑双11大促期间10万+并发链路的实时排查,未发生因追踪系统延迟导致的客诉;4)输出《分布式链路追踪系统数据管理规范》,成为公司全产品线的标准方案,我个人也因此晋升为运维开发组技术负责人。
2020.06 - 2022.02
星途互动科技有限公司
高级运维开发工程师

容器化微服务集群全自动化运维平台研发项目

  • 项目背景:公司从传统虚拟机部署全面转向Kubernetes,但初期依赖脚本和零散工具(如kubectl、Helm),存在“部署靠人工核对配置”“故障需手动排查”“扩容响应慢”等问题——单次微服务部署耗时超2小时,故障恢复平均30分钟,支撑不了业务快速迭代的需求。我的目标是构建“部署-监控-自愈”一体化的自动化平台,将运维从“救火”转向“预防”。
  • 关键难题与技术:1)多环境(开发/测试/预发/生产)的配置差异大,容易出现“测试通过、生产报错”的问题;2)故障自愈依赖固定规则(如CPU≥80%重启Pod),无法处理复杂场景(如数据库连接池泄漏导致的偶发错误);3)需与现有监控系统(Prometheus)、日志系统(ELK)打通,实现告警事件的自动流转。我选择K8s CRD(自定义资源定义)扩展平台能力,结合Ansible做配置管理,用随机森林算法训练故障预测模型。
  • 核心行动与创新:1)设计“业务应用”CRD,封装部署所需的镜像、资源配置、环境变量等信息,通过模板引擎动态渲染多环境配置(如生产环境副本数是开发的2倍),实现“一次定义、多环境部署”;2)搭建故障知识库,收集过去1年的故障案例(如“MySQL慢查询导致API超时”“Redis缓存击穿”),提取特征(如QPS波动、错误日志关键词)训练随机森林模型,提前15分钟预警潜在故障;3)与监控团队合作,打通Prometheus Alertmanager,将告警事件映射为平台自愈动作(如“CPU高”触发扩容、“错误率超5%”触发Pod重启),并通过Webhook通知研发侧。
  • 项目成果与价值:1)微服务部署效率提升70%(单次部署≤20分钟),配置错误率从15%降至2%;2)故障恢复时间从30分钟缩短至5分钟内,全年减少因运维延迟导致的营收损失约200万元;3)平台支持500+个微服务实例的自动化运维,运维人力投入降低30%(从8人减至5人);4、平台成为公司核心运维工具,我也因此获得当年“公司技术创新奖”。
技能特长
沟通能力
执行能力
热情坦诚
文案能力
奖项荣誉
  • DevOps工程师(中级)职业技能等级证书
  • 2023年度公司项目攻坚奖
  • 2024年第一季度优秀员工
自我评价
  • 深耕互联网DevOps全链路,以“研发效率与系统韧性双提升”为核心,搭建需求交付到运行维护的自动化闭环。
  • 习惯用“流程-工具-组织”三层模型拆解效能瓶颈,擅长联动跨团队将零散优化转化为体系化能力。
  • 主动贴合业务节奏设计方案,从流量特征倒推监控与弹性策略,让运维支撑更契合业务峰值需求。
  • 保持对云原生、IaC等新技术敏锐追踪,落地时会结合团队现状适配改造,避免“为技术而技术”。
报考信息
填写报考学校
填写报考专业
科目1
分数1
科目2
分数2
科目3
分数3
科目4
分数4
试一下,换个颜色
选择配色
使用此模板创建简历
  • 支持电脑端、微信小程序编辑简历
  • 支持一键更换模板,自由调整字距行距
  • 支持微信分享简历给好友查看
  • 支持简历封面、自荐信、自定义简历模块
  • 支持导出为PDF、图片、在线打印、云端保存
该简历模板已内置
  • 个人名称
  • 头像
  • 基本信息
  • 求职意向
  • 工作经历
  • 项目经验
  • 实习经验
  • 作品展示
  • 奖项荣誉
  • 校园经历
  • 教育背景
  • 兴趣爱好
  • 技能特长
  • 语言能力
  • 自我评价
  • 报考信息
  • 简历封面
  • 自荐信
对话框
提示
说明