当前模板已根据「SRE运维工程师」岗位深度优化
选择其他岗位
开始编辑模板后,您可以进一步自定义包括:工作履历、工作内容、信息模块、颜色配置等
内置经深度优化的履历,将为你撰写个人简历带来更多灵感。
陆明哲的照片
陆明哲
责任心不是口号,而是渗透在每个工作细节中的行动准则。
28岁
3年工作经验
13800138000
DB@zjengine.com
求职意向
SRE运维工程师
天津
薪资面谈
一个月内到岗
工作经历
2022.07 - 2024.06
小楷电商
高级SRE运维工程师

负责电商平台核心交易链路的全生命周期稳定性管理,主导容量规划、故障根因分析及自动化工具链建设,平衡业务迭代速度与系统可靠性,覆盖从日常运维到双十一大促的全场景保障。

  • 主导核心交易链路(商品下单-支付-履约)SLO体系重构,基于Google SRE方法论定义8项关键SLI(如接口成功率≥99.99%、订单创建耗时P95≤200ms),通过Go语言开发动态阈值告警引擎,联动Prometheus+Grafana实现秒级指标采集与多维度聚合,故障发现时间从15分钟压缩至3分钟内,SLO达成率从98.7%提升至99.95%。
  • 设计并落地混沌工程常态化机制,基于Chaos Mesh搭建故障注入平台,针对数据库主从延迟、Redis缓存击穿、RPC服务降级等12类高风险场景设计实验剧本,季度演练覆盖率从60%提升至95%;结合故障复盘优化熔断策略,年度P1级系统故障次数从7次降至2次,MTTR(平均修复时间)从45分钟缩短至18分钟。
  • 牵头大促容量规划项目,通过历史流量建模+实时压测(使用JMeter分布式集群模拟20万QPS)预测资源需求,结合K8s HPA与云厂商弹性伸缩策略,实现计算资源利用率从65%提升至82%;同步优化CDN节点分布,将核心静态资源加载耗时P90从800ms降至350ms,支撑双十一峰值58万订单/秒的稳定处理。
  • 推动运维工具链自动化升级,主导开发故障自愈系统(集成Python+Ansible),覆盖服务器宕机重启、日志异常切割、慢SQL自动优化等18类高频操作,日均节省人工干预时间4小时,关键操作自动化率从55%提升至88%。
2020.05 - 2022.06
小楷科技
SRE运维工程师(中级)

聚焦用户增长业务线的稳定性运维,负责微服务架构下的服务治理、监控体系优化及跨团队协作,支撑业务从日均10万UV到500万UV的快速迭代。

  • 优化全链路监控体系,针对用户注册-登录-信息修改流程,通过OpenTelemetry实现跨语言(Java/Go)链路追踪,定位到3个隐藏的慢调用节点(如第三方风控接口耗时占比35%),推动开发侧优化后整体流程耗时下降40%,用户转化率提升2.3%。
  • 建立服务健康度评分模型,基于CPU/内存使用率、GC频率、接口错误率等12项指标,通过机器学习算法动态评估服务状态,提前72小时预警2次数据库连接池泄漏风险,避免P2级故障演变为P1级事故,相关模型被纳入公司SRE标准工具库。
  • 主导容器化迁移项目,将传统部署的200+微服务迁移至K8s集群,设计滚动更新策略与资源配额限制,迁移期间业务可用性保持99.98%;同步优化HPA触发条件,将扩缩容响应时间从5分钟缩短至1分钟,资源成本降低25%。
  • 负责跨团队故障协作流程优化,制定《故障响应SLA手册》,明确开发/测试/运维的责任边界与沟通节点,故障处理会议时长减少60%,跨团队投诉率下降75%。
2018.03 - 2020.04
小楷互联
运维工程师(初级)

承担公司内部管理系统(OA/CRM)及部分业务系统的日常运维,负责服务器管理、版本发布支持及基础故障排查,为向SRE转型积累全栈运维经验。

  • 搭建私有云监控平台(基于Zabbix+ELK),实现200+物理机/虚拟机的CPU、磁盘、网络指标采集与可视化,自定义告警规则50+条,关键系统故障预警准确率从70%提升至90%,获部门“运维效率之星”奖项。
  • 主导MySQL主从集群优化,通过调整binlog格式、优化慢查询(累计优化120+条)、引入读写分离中间件,将主库QPS上限从800提升至1500,支撑CRM系统用户量翻倍增长。
  • 负责版本发布全流程支持,编写自动化部署脚本(Shell+Python)替代人工操作,将单次发布耗时从2小时缩短至20分钟,发布失败率从15%降至3%,获开发团队“最佳协作奖”。
项目经验
2022.05 - 2023.08
星途互动科技有限公司
运维开发工程师(云原生方向)

分布式电商平台全链路运维中台研发及规模化落地

  • 项目背景:公司核心电商平台服务节点从300+扩展至3000+,传统运维模式依赖分散脚本,导致故障MTTR平均30分钟、资源利用率不足40%、跨环境配置漂移率达15%,严重影响大促稳定性与成本效率。目标是通过云原生技术构建统一运维中台,整合监控、部署、故障自愈、资源调度能力,实现运维标准化与智能化。我的职责是主导中台核心模块设计、技术选型及全业务线落地,跨研发、测试、业务团队协同。
  • 关键难题:①多环境(测试/预发/生产)配置一致性难保障,原有Ansible方案易因人工干预导致漂移;②故障自愈准确率低(仅60%),误报率高影响运维体验;③资源调度无法适配业务峰谷(如大促期间QPS暴涨5倍),静态扩缩容导致资源浪费或不足。
  • 核心行动:①针对配置一致性,设计GitOps驱动的配置管理流程,基于Argo CD实现配置版本化与持续部署,同时开发自定义配置校验工具(基于OpenPolicy Agent),强制校验K8s资源、环境变量的合规性,将配置漂移率降至0.1%以下;②针对故障自愈,采集半年内10万+条故障日志,用XGBoost训练故障分类模型(识别网络超时、Pod OOM、数据库慢查询等8类高频故障),集成至中台实现故障根因定位(RCA)与自动修复(如重启异常Pod、扩容副本);③针对资源调度,开发业务流量预测模块(基于LSTM模型预测QPS、PV峰值),联动K8s HPA与Cluster Autoscaler,实现“预测-扩缩-回收”的动态资源管理。
  • 项目成果:中台上线6个月内覆盖8条核心业务线,支撑双11大促零故障运行。MTTR降至7.8分钟(下降74%),资源利用率提升至68%(年节省服务器成本210万元),故障自愈率达92%。成为公司云原生运维标准平台,我主导的GitOps配置管理模块被纳入《企业云原生运维规范》,个人获当年公司“技术创新一等奖”。
2020.03 - 2021.12
星途互动科技有限公司
运维开发工程师(基础架构方向)

高并发日志系统从0到1搭建及性能优化

  • 项目背景:公司业务从单一APP扩展至多端(小程序、H5、PC),日志量从日均800GB暴增至1.2TB,原有ELK体系出现查询延迟超15秒、存储成本占比达运维总预算35%、缺乏业务维度实时分析能力等问题,无法支撑故障快速溯源与业务优化。目标是搭建高吞吐、低延迟、可扩展的日志系统,支持秒级查询与实时业务洞察。我的职责是负责系统架构设计、核心组件开发及性能调优。
  • 关键难题:①日志采集性能瓶颈,Filebeat在高并发下丢数据率达2%,影响日志完整性;②Elasticsearch存储成本高且索引管理复杂,冷数据查询效率低;③缺乏实时分析能力,无法关联用户行为与接口错误定位问题。
  • 核心行动:①优化日志采集链路,用Fluentd替代Filebeat,通过批量发送(Batch Size=1000)、本地Buffer缓存(容量5GB)及重试机制,将丢数据率降至0.005%以下;②设计分层存储策略:热数据(7天内)存ClickHouse(列式存储优化查询),温数据(7-30天)存Elasticsearch,冷数据(30天以上)归档至OSS,存储成本降低42%;③开发实时分析Pipeline:用Flink消费日志流,提取业务标签(如用户ID、接口路径、地域),生成接口成功率、页面加载时长等10+核心指标,同步至监控平台实现秒级预警。
  • 项目成果:系统支撑公司日活从120万增长至600万,日志查询延迟稳定在1秒内,支持每秒15万条日志处理。实时分析功能帮助业务团队定位了2次大促期间的支付接口超时问题(原因是第三方支付回调日志丢失),将故障处理时间从40分钟缩短至8分钟。该系统成为公司基础架构的“日志中枢”,我个人主导的Fluentd优化方案被写入公司《日志采集最佳实践》。
技能特长
沟通能力
执行能力
热情坦诚
文案能力
奖项荣誉
  • 信息系统运维工程师(中级)
  • 2021年度季度服务之星
  • 2022年度公司优秀员工
  • 2023年项目攻坚奖
自我评价
  • 聚焦互联网业务稳定性核心,擅长从分布式系统全链路视角构建风险防控体系,推动被动响应向主动预防的机制落地。
  • 以自动化为效能引擎,将运维痛点转化为可复用工具链,通过代码优化降低人工依赖,助力团队转向策略型保障。
  • 具备业务与技术双向同理心,能平衡迭代速度与稳定性要求,推动跨团队共识,确保方案落地不脱节。
  • 习惯数据量化运维价值,通过故障复盘反哺架构优化,持续迭代SLO体系,支撑业务决策的可用性与成本洞察。
试一下,换个颜色
选择配色
使用此模板创建简历
  • 支持电脑端、微信小程序编辑简历
  • 支持一键更换模板,自由调整字距行距
  • 支持微信分享简历给好友查看
  • 支持简历封面、自荐信、自定义简历模块
  • 支持导出为PDF、图片、在线打印、云端保存
该简历模板已内置
  • 个人名称
  • 头像
  • 基本信息
  • 求职意向
  • 工作经历
  • 项目经验
  • 实习经验
  • 作品展示
  • 奖项荣誉
  • 校园经历
  • 教育背景
  • 兴趣爱好
  • 技能特长
  • 语言能力
  • 自我评价
  • 报考信息
  • 简历封面
  • 自荐信
对话框
提示
说明