当前模板已根据「SRE运维工程师」岗位深度优化
选择其他岗位
开始编辑模板后,您可以进一步自定义包括:工作履历、工作内容、信息模块、颜色配置等
内置经深度优化的履历,将为你撰写个人简历带来更多灵感。
陆明哲
昨天的经验是今天的基石,而今天的突破将成为明天的标准。
28岁
3年工作经验
13800138000
DB@zjengine.com
陆明哲的照片
求职意向
SRE运维工程师
天津
薪资面谈
一周内到岗
工作经历
2024.07 - 至今
小楷生活服务科技
SRE技术专家

负责生活服务平台(到家服务+本地商家入驻)的高可用架构设计与稳定性运营,引领SRE团队技术方向、最佳实践落地及智能化运维能力升级,边界涵盖多活架构搭建、AIops故障预测、组织文化塑造及关键项目技术攻坚,聚焦平台全年99.995%以上可用性目标

  • 设计并落地平台级多活架构,覆盖北京、上海、广州三地数据中心——采用GSLB实现流量智能调度,结合Redis Cluster跨地域同步(延迟控制在5ms内)与MySQL Group Replication保证数据一致性,解决跨地域故障切换慢、数据漂移问题,平台可用性从99.99%提升至99.995%,跨地域故障切换时间从3分钟缩短至58秒内
  • 主导构建SRE智能化运维平台,整合AIops能力实现故障闭环管理:基于TensorFlow训练CPU负载异常、磁盘IO瓶颈等6类故障预测模型,用Flink流处理框架实时分析1000+ metrics数据,模型准确率达95%;结合ChatOps打通企业微信与Prometheus、Argo CD工具链,实现‘报警-诊断-修复’自动化,自动化故障处理率从20%提升至70%,MTTR降至2分钟内,年节省故障排查人力超400小时
  • 推动SRE组织与文化升级,建立‘认证-培训-考核’体系:制定SRE初级/中级/高级认证标准(覆盖混沌工程、容量规划、可观测性等技能),编写《生活服务SRE最佳实践手册》(含故障复盘模板、自动化工具使用指南),定期举办‘故障注入演练周’与‘SRE技术沙龙’,团队整体技术评分从72分提升至95分,获公司‘年度卓越技术团队’称号
  • 攻坚本地商家端高并发接入项目:支撑平台快速接入10万+本地餐饮/家政商家,应对商家后台‘批量上传商品’‘节日促销下单’等场景流量波动(峰值QPS达8000)——用Kafka做消息队列削峰填谷(吞吐量提升至10万TPS),结合TiDB分布式数据库实现数据分片存储(查询延迟稳定在100ms内),商家端接口成功率从99.2%提升至99.95%,支撑平台GMV年增长52%
2022.07 - 2024.06
小楷零售科技
资深SRE工程师

负责零售全渠道系统(线上商城+线下3000+门店POS+供应链中台)的全生命周期稳定性管理,推动SRE文化落地、跨团队协作及智能化运维工具平台化建设,边界覆盖分布式链路追踪、混沌工程常态化、SLI/SLO体系共建及运维效率优化

  • 主导全渠道系统分布式链路追踪体系建设,解决多技术栈(Java/Go/Node.js)兼容问题——开发OpenTelemetry Adapter统一tracing数据格式,整合Jaeger与业务日志(ELK Stack),实现‘请求从APP端到供应链’全链路可视化,故障定位时间从20分钟缩短至3分钟内,研发与运维跨团队排障效率提升70%
  • 设计并实施混沌工程常态化机制:每月针对核心系统(如订单支付、库存扣减)进行故障注入(数据库宕机、网络分区、缓存击穿),用Chaos Engineering Platform自动化执行演练(覆盖生产环境灰度场景),制定‘风险预评估-演练执行-复盘改进’SOP,全年生产环境重大故障从5起降至1起,MTTR下降40%
  • 推动SRE工具平台化,解决现有工具分散问题——基于K8s Operator开发自定义控制器,整合Prometheus(监控)、Argo CD(CI/CD)、Velero(备份)功能,实现‘一键查看服务健康状态-一键回滚版本-一键恢复备份’的运维闭环,运维操作耗时减少50%,新员工上手时间从2周缩短至3天
  • 共建零售业务SLI/SLO体系:联合研发、产品团队定义核心指标(如下单成功率≥99.9%、支付响应时间≤500ms、库存准确率≥99.95%),将SLO纳入研发迭代评审(未达标功能不得上线),通过数据展示SLO对产品质量的提升(下单成功率从99.5%升至99.9%),研发团队对SRE的认可度从65%提升至92%
2020.07 - 2022.06
小楷电商科技
SRE工程师

负责电商平台订单中心与库存系统的稳定性保障、自动化运维体系搭建及大促期间容量规划与风险防控,边界涵盖系统监控、故障排查、自动化工具开发及跨团队稳定性协作,支撑双11/618大促订单峰值处理

  • 主导订单中心从单体到微服务的稳定性改造:定制化开发Prometheus Exporter补全‘订单创建失败率’‘库存扣减耗时’等业务指标,用Grafana搭建‘基础设施-应用-业务’三层监控看板,解决旧系统指标缺失导致的故障定位滞后问题,MTTR从30分钟降至5分钟内,订单系统SLA从99.9%提升至99.99%
  • 负责双11容量规划与风险防控:用Chaos Mesh模拟‘库存系统数据库宕机’‘订单队列积压’等场景,验证跨地域流量调度方案(将流量从故障地域引流至健康节点),结合AWS Auto Scaling动态扩容EC2实例(峰值扩容至200台),大促期间订单系统吞吐量提升40%,实现‘零宕机、零超卖’
  • 搭建自动化运维工具链:基于Ansible实现服务器初始化与配置管理,用Terraform管理阿里云资源(ECS/RDS/OSS),整合Jenkins+Argo CD构建CI/CD pipeline(支持Java/Python服务部署),解决人工部署依赖高、易出错问题,部署效率提升60%,人为配置错误减少85%
  • 推动服务器成本优化:用AWS Cost Explorer分析资源利用率,识别出30%闲置EC2实例与20%冗余RDS读副本,引入Spot Instance(占比达40%)与自动伸缩组,年度服务器成本下降30%(约240万元),同时保证系统性能无明显波动
技能特长
沟通能力
执行能力
热情坦诚
文案能力
兴趣爱好
摄影
看书
阅读
跑步
自我评价
  • 深耕互联网SRE多年,以“业务连续性”为核心,用系统性思维拆解链路风险,将稳定性保障嵌入研发全流程。
  • 擅长做跨团队“技术翻译官”,把运维稳定性要求转化为研发可落地的架构调整,弥合迭代与稳定的矛盾。
  • 习惯从故障中沉淀预防机制,用“向前一步”的主动性减少重复问题对业务的影响。
  • 紧跟云原生、AIOps趋势,将其落地到运维体系,支撑业务规模化下的稳定性与效率需求。
试一下,换个颜色
选择配色
使用此模板创建简历
  • 支持电脑端、微信小程序编辑简历
  • 支持一键更换模板,自由调整字距行距
  • 支持微信分享简历给好友查看
  • 支持简历封面、自荐信、自定义简历模块
  • 支持导出为PDF、图片、在线打印、云端保存
该简历模板已内置
  • 个人名称
  • 头像
  • 基本信息
  • 求职意向
  • 工作经历
  • 项目经验
  • 实习经验
  • 作品展示
  • 奖项荣誉
  • 校园经历
  • 教育背景
  • 兴趣爱好
  • 技能特长
  • 语言能力
  • 自我评价
  • 报考信息
  • 简历封面
  • 自荐信
对话框
提示
说明