当前模板已根据「SRE运维工程师」岗位深度优化
选择其他岗位
开始编辑模板后,您可以进一步自定义包括:工作履历、工作内容、信息模块、颜色配置等
内置经深度优化的履历,将为你撰写个人简历带来更多灵感。
陆明哲的照片
28岁
3年工作经验
13800138000
DB@zjengine.com
求职意向
SRE运维工程师
天津
薪资面谈
一个月内到岗
技能特长
沟通能力
执行能力
热情坦诚
文案能力
兴趣爱好
摄影
看书
阅读
跑步
陆明哲
责任心不是口号,而是渗透在每个工作细节中的行动准则。
工作经历
2022.07 - 2024.08
小楷云途科技有限公司
高级SRE运维工程师

负责公司核心电商交易链路全生命周期SRE保障,涵盖SLO体系搭建、故障根因分析、K8s集群自治及跨团队可靠性工程实践落地

  • 主导电商交易核心服务(日请求量超10亿次)的SLO体系设计,基于ITU-T Y.1540标准定义99.99%可用性、P99≤200ms延迟等关键指标,通过Prometheus Alertmanager定制分级告警规则(区分P0-P3级),将误报率从18%降至3%,支撑双11大促期间0级故障响应时间缩短至5分钟内,保障交易链路零中断
  • 核心参与混沌工程实践,使用Chaos Mesh对订单支付链路注入节点宕机、网络分区、第三方接口超时等故障,识别出3个单点依赖组件(如库存服务同步接口),推动研发重构为“分布式缓存+Kafka异步队列”方案,全年该链路故障次数从12次降至2次,MTTR从45分钟缩短至12分钟
  • 负责500节点K8s集群自治运维,编写Python脚本集成Cluster API与自定义控制器,实现“CPU持续5分钟>85%”“内存泄漏率>10%/小时”等条件触发节点自动置换,将集群运维人力投入从每周12人时降至3人时,节点可用率提升至99.95%
  • 牵头跨研发、产品、测试团队落地容量规划流程,使用Gatling模拟峰值QPS 15万的场景压测,结合历史流量30%同比增长预测资源需求,优化EC2 Auto Scaling策略,大促期间服务器成本降低15%,未出现性能瓶颈
2020.06 - 2022.06
小楷数智科技有限公司
资深SRE运维工程师

负责金融科技核心系统(支付清算、风险控制)SRE运维,聚焦高可用架构设计、故障预防及DevOps工具链整合

  • 主导支付清算系统(日均处理1000万笔交易)高可用改造,设计两地三中心多活架构,使用Keepalived+Nginx实现流量秒级切换,通过年度容灾演练验证RTO≤30秒、RPO≤5秒,满足银保监会《商业银行业务连续性监管指引》要求
  • 搭建ELK+Jaeger全链路追踪体系,关联业务操作日志与系统metrics、追踪数据,将风险控制系统故障定位时间从60分钟缩短至15分钟,其中链路依赖问题导致的故障占比从25%降至8%,支撑风控决策响应速度提升20%
  • 整合DevOps工具链,将Jenkins流水线与Ansible、Terraform结合,实现“代码提交→镜像构建→K8s部署→自动化验证”全流程自动化,部署时长从45分钟缩短至10分钟;引入SonarQube代码质量门禁,阻断低质量代码上线,研发交付故障率降低20%
  • 编写《金融科技系统可靠性工程手册》,涵盖故障管理、容量规划、混沌工程等8个模块,组织季度跨团队培训(覆盖80人次),推动团队整体MTTR下降18%
2018.07 - 2020.05
小楷互联科技有限公司
SRE工程师

负责公司CDN平台日常运维,保障边缘节点稳定性、内容分发效率及用户访问体验

  • 搭建CDN节点健康度评分模型(维度包括带宽利用率、请求成功率、延迟),使用Go语言开发监控插件集成Zabbix,实现异常节点提前2小时预警,节点故障率从每月5%降至1.2%,用户访问失败率下降40%
  • 分析用户访问日志(日均10亿条)发现热点内容(影视剧预告片)缓存命中率仅65%,通过调整Redis缓存策略(增加本地节点缓存层、延长热点内容过期时间至24小时),将缓存命中率提升至88%,源站带宽成本降低22%(年节省约300万元)
  • 主导处理某地区节点大规模宕机故障(影响50万用户),快速定位为运营商DNS解析故障,协调切换备用DNS并通过应急脚本将流量引流至周边健康节点,故障恢复时间控制在1小时内,实际影响用户降至8万
  • 编写Shell脚本实现CDN节点配置批量下发(覆盖1000+节点),替代人工逐台操作,配置错误率从3%降至0.1%,单次配置变更耗时从2小时缩短至15分钟,运维效率提升50%
项目经验
2022.07 - 2024.03
星途互动科技有限公司
资深运维开发工程师

电商大促高可用保障体系全链路升级项目

  • 项目背景:公司核心电商平台面临逐年攀升的大促流量压力——2021年双11峰值QPS达80万时,曾因数据库连接池耗尽、缓存击穿导致页面响应超时率达12%,故障 downtime 超过30分钟,严重影响用户体验与GMV转化。核心目标是通过全链路技术升级,支撑2024年双11120万QPS峰值,将故障 downtime 控制在5分钟内,同时降低日常运维人力投入。
  • 关键难题:①现有监控体系碎片化,仅覆盖服务CPU/内存,未穿透至数据库慢查询、缓存命中率、下游接口延迟等业务链路关键节点;②流量调度依赖人工经验,无法快速适配突发峰值;③容灾演练流于“脚本执行”,故障切换时间长且易遗漏边缘场景。
  • 核心行动:1. 主导设计“三层全链路监控体系”:应用层用Prometheus+Grafana定制指标(如MySQL连接池利用率、Redis热点key命中率),中间件层通过ELK关联服务日志与数据库慢查询日志,用户层接入New Relic监控前端接口成功率与首屏加载时间,实现“从用户点击到数据库操作”的全链路可观测;2. 开发智能流量调度引擎:基于Python+TensorFlow训练流量预测模型(准确率达92%),联动Nginx Plus与CDN厂商API,实时调整节点权重与流量分发策略,支撑峰值流量自动削峰填谷;3. 推动混沌工程标准化:用Chaos Mesh模拟数据库宕机、缓存击穿、下游服务熔断等12类场景,重构故障切换脚本(将Redis主从切换从依赖VIP漂移改为直接连接哨兵),并通过GitOps实现演练脚本版本化管理。
  • 项目成果:成功支撑2023年618(峰值QPS115万)与2024年双11(峰值QPS132万),全程零 downtime;故障排查时间从40分钟缩短至8分钟,日常运维人力投入减少40%;监控覆盖率从65%提升至98%,提前预警并解决潜在风险17起。本人主导了体系设计与核心模块开发,推动跨团队(研发、测试、产品)达成“全链路可观测”共识,成为公司大促保障的标准技术方案。
2020.05 - 2022.06
云帆科技有限公司
运维开发工程师

容器化平台自动化运维工具链研发项目

  • 项目背景:公司推进容器化战略,K8s集群规模从50个服务扩展至200个服务,但运维工具分散(依赖kubectl命令、Jenkins Pipeline拼接、手动修改ConfigMap),导致部署失败率达每月10次,单次部署耗时超2小时,严重拖慢迭代节奏。核心目标是构建统一的自动化工具链,将部署时间压缩至30分钟内,配置错误率降至0.1%以下。
  • 关键难题:①K8s原生API复杂度高,开发自定义功能门槛大;②不同业务线的部署需求差异大(如电商服务需滚动更新,金融类服务需蓝绿部署);③缺乏统一的配置模板,各服务YAML文件冗余且易冲突。
  • 核心行动:1. 基于K8s Operator框架开发“自定义部署控制器”,封装滚动更新、蓝绿部署、金丝雀发布三种通用模式,提供REST API供研发团队调用,隐藏底层K8s细节;2. 设计“服务配置模板中心”:用YAML Schema定义通用字段(如镜像版本、副本数、资源 limits),研发人员仅需填写业务参数即可生成合规YAML,避免配置冲突;3. 集成CI/CD流水线:将Jenkins Pipeline与工具链对接,实现“代码提交→镜像构建→自动化测试→部署到预发环境→全链路验证→生产部署”的全流程自动化,同时嵌入配置校验插件(用Schema Registry检查YAML合法性)。
  • 项目成果:工具链上线后,单次部署时间从125分钟缩短至28分钟,配置错误率从10次/月降至0;支撑公司3个核心业务(电商、社交、金融)完成容器化迁移,运维人力成本降低30%;工具被纳入公司技术中台,成为所有研发团队的标准运维入口。本人主导了需求调研与架构设计,完成了Operator控制器的核心逻辑开发,推动跨团队达成“配置标准化”与“流程自动化”的共识。
教育背景
2014.09 - 2017.06
XX实验高级中学
文科综合班
通过辩论社核心训练(市级最佳辩手),形成结构化表达与快速信息整合能力;发起“乡村中学读书角”公益项目,协调多方资源覆盖8所学校,验证项目0-1落地方法论。
2017.09 - 2021.06
XX师范大学
汉语言文学(本科)
深耕内容创作与传播理论(核心课程优秀率90%),建立用户心理洞察方法论;运营校级公众号期间,通过内容策略调整使粉丝量3个月增长200%(1.5万→4.5万),输出《高校新媒体爆款公式》被20+社团采用。获全国大学生新媒体运营大赛银奖。
奖项荣誉
  • 信息系统运维管理师(中级)
  • 2023年度公司优秀员工
  • 2024年部门项目攻坚奖
自我评价
  • 聚焦互联网业务稳定性核心,擅长从分布式系统全链路视角构建风险防控体系,推动被动响应向主动预防的机制落地。
  • 以自动化为效能引擎,将运维痛点转化为可复用工具链,通过代码优化降低人工依赖,助力团队转向策略型保障。
  • 具备业务与技术双向同理心,能平衡迭代速度与稳定性要求,推动跨团队共识,确保方案落地不脱节。
  • 习惯数据量化运维价值,通过故障复盘反哺架构优化,持续迭代SLO体系,支撑业务决策的可用性与成本洞察。
试一下,换个颜色
选择配色
使用此模板创建简历
  • 支持电脑端、微信小程序编辑简历
  • 支持一键更换模板,自由调整字距行距
  • 支持微信分享简历给好友查看
  • 支持简历封面、自荐信、自定义简历模块
  • 支持导出为PDF、图片、在线打印、云端保存
该简历模板已内置
  • 个人名称
  • 头像
  • 基本信息
  • 求职意向
  • 工作经历
  • 项目经验
  • 实习经验
  • 作品展示
  • 奖项荣誉
  • 校园经历
  • 教育背景
  • 兴趣爱好
  • 技能特长
  • 语言能力
  • 自我评价
  • 报考信息
  • 简历封面
  • 自荐信
对话框
提示
说明