当前模板已根据「SRE运维工程师」岗位深度优化
选择其他岗位
开始编辑模板后,您可以进一步自定义包括:工作履历、工作内容、信息模块、颜色配置等
内置经深度优化的履历,将为你撰写个人简历带来更多灵感。
陆明哲
责任心不是口号,而是渗透在每个工作细节中的行动准则。
28岁
3年工作经验
13800138000
DB@zjengine.com
陆明哲的照片
求职意向
SRE运维工程师
天津
薪资面谈
到岗时间另议
工作经历
2022.07 - 2024.06
小楷电商科技有限公司
高级SRE运维工程师

负责电商平台核心交易链路(含秒杀、支付、库存)的全生命周期稳定性保障,主导自动化运维体系建设与容量规划,推动DevOps文化落地以提升研发-运维协同效率,覆盖日均10亿级PV系统的可用性与成本优化。

  • 主导设计「交易链路全链路压测+混沌工程」双轮驱动的稳定性体系:基于JMeter+ChaosBlade构建故障注入场景,覆盖数据库慢查询、RPC调用超时、缓存击穿等12类高频故障,结合Prometheus Alertmanager定制分级告警规则(MTTR从4.2分钟降至1.8分钟);推动开发团队将压测左移至CI环节,上线前拦截潜在稳定性风险案例37起,大促期间系统可用性达99.99%(同比提升0.03%)。
  • 牵头Kubernetes集群从混合云向全托管EKS迁移:针对原自建集群节点利用率低(平均35%)、扩容耗时长的痛点,设计「业务优先级+弹性伸缩策略」模型,通过Karpenter实现节点自动扩缩容,迁移后集群资源成本下降28%;同步改造HPA为QPS驱动型策略,结合业务流量预测算法(MAPE≤8%),支撑双11峰值QPS 58万的无损扩容。
  • 推动建立「可观测性中台」:整合日志(ELK)、指标(Prometheus)、追踪(Jaeger)数据,开发「服务健康度评分」看板(涵盖错误率、延迟、依赖拓扑等15项指标),将跨团队排障时间从平均2小时压缩至25分钟;主导接入阿里云ARMS实现全链路追踪,定位一次支付回调超时问题仅需12分钟(原需1.5小时)。
  • 优化容量规划流程:基于历史流量、促销活动、用户增长数据构建线性回归预测模型(R²=0.92),结合业务SLO反推资源需求,推动研发侧将「冗余部署30%」的粗放策略调整为「动态预留+弹性补偿」,年度服务器采购成本减少180万元。
2020.05 - 2022.06
小楷生活服务平台
SRE运维工程师

负责本地生活服务类系统(含商家后台、订单中心、配送调度)的稳定性运维与效率提升,主导自动化工具链开发与运维流程标准化,支撑平台从日单50万向200万的业务增长。

  • 重构自动化运维平台:基于Ansible+SaltStack开发「配置管理引擎」,解决多环境(测试/预发/生产)配置漂移问题,配置变更成功率从92%提升至99.6%;集成Jenkins搭建「发布流水线」,实现代码提交→自动化测试→灰度发布→全量上线的全流程管控,部署耗时从45分钟缩短至8分钟,人为操作失误导致的故障减少70%。
  • 主导数据库高可用改造:针对MySQL主从架构切换耗时(平均8秒)、数据一致性风险高的问题,引入ProxySQL实现读写分离与故障自动切换,结合pt-heartbeat监控复制延迟,将切换时间压缩至2秒内;推动开发侧实现「业务无感化分库分表」,单库QPS承载能力从3000提升至1.2万。
  • 建立「服务治理指标库」:定义接口成功率(≥99.95%)、超时率(≤0.1%)、依赖服务健康度等核心指标,通过自研脚本实时监控异常波动,提前发现并解决RPC服务慢调用问题19例;推动业务团队将SLO纳入研发KPI考核,系统主动故障占比从15%降至5%。
  • 落地日志结构化与智能分析:改造Nginx、Tomcat日志格式为JSON,通过Logstash清洗后存入ES,开发「异常请求特征提取」规则(如连续5次504状态码),自动触发告警并关联排查方向,日志排查效率提升60%;结合Flink实现实时流量异常检测,大促期间拦截恶意请求12万次。
2018.03 - 2020.04
小楷在线教育科技有限公司
运维开发工程师(向SRE转型)

负责在线教育直播、IM、题库系统的运维支持,主导基础架构自动化与监控体系搭建,推动传统运维向SRE模式过渡,支撑平台用户从500万向1200万的增长。

  • 自主研发「轻量级监控平台」:基于Python+InfluxDB+Grafana,实现服务器CPU/内存/磁盘指标、中间件连接数/队列长度的可视化监控,替代原有Zabbix模板化监控的局限性;开发「异常阈值自学习」功能(基于30天历史数据动态调整告警阈值),误报率从40%降至8%,关键指标漏报率为0。
  • 优化直播系统推流稳定性:针对RTMP推流卡顿问题,通过Wireshark抓包分析发现DNS解析耗时过长(平均300ms),推动替换为CoreDNS并配置本地缓存,解析时间降至50ms以内;同步优化CDN节点调度策略,推流成功率从98.2%提升至99.7%,用户投诉率下降65%。
  • 推动运维流程标准化:编写《服务器初始化手册》《故障应急响应SOP》等文档12份,定义「故障分级(P0-P4)」「升级路径」「复盘模板」;主导月度故障演练(覆盖网络中断、数据库宕机等场景),团队应急响应时间从30分钟缩短至10分钟,故障复盘整改率100%。
  • 参与容器化试点项目:协助开发团队将题库系统迁移至Docker,解决容器网络性能损耗(原TCP转发延迟增加20ms)问题,通过调整iptables规则与启用网桥模式,延迟恢复至基线水平;输出《容器化运维注意事项》供其他团队参考,推动公司容器化覆盖率从0提升至35%。
技能特长
沟通能力
执行能力
热情坦诚
文案能力
兴趣爱好
摄影
看书
阅读
跑步
自我评价
  • 深扎互联网SRE“稳效平衡”核心,习惯从业务链路视角预判系统风险,提前布局容灾与容量策略。
  • 专长用自动化工具链补全运维盲区,擅长以“故障根因+流程断点”拆解复杂问题,推动跨团队闭环。
  • 做“技术边界翻译官”,能将运维稳定性要求转化为研发编码/发布规范,降低后期故障成本。
  • 紧跟云原生/SRE前沿,习惯把最佳实践拆解为团队可执行动作,驱动运维能力持续迭代。
试一下,换个颜色
选择配色
使用此模板创建简历
  • 支持电脑端、微信小程序编辑简历
  • 支持一键更换模板,自由调整字距行距
  • 支持微信分享简历给好友查看
  • 支持简历封面、自荐信、自定义简历模块
  • 支持导出为PDF、图片、在线打印、云端保存
该简历模板已内置
  • 个人名称
  • 头像
  • 基本信息
  • 求职意向
  • 工作经历
  • 项目经验
  • 实习经验
  • 作品展示
  • 奖项荣誉
  • 校园经历
  • 教育背景
  • 兴趣爱好
  • 技能特长
  • 语言能力
  • 自我评价
  • 报考信息
  • 简历封面
  • 自荐信
对话框
提示
说明