当前模板已根据「DevOps工程师」岗位深度优化
选择其他岗位
开始编辑模板后,您可以进一步自定义包括:工作履历、工作内容、信息模块、颜色配置等
内置经深度优化的履历,将为你撰写个人简历带来更多灵感。
陆明哲的照片
陆明哲
在平凡的岗位上创造不平凡的价值,这是我的职业信仰。
28岁
3年工作经验
13800138000
DB@zjengine.com
求职意向
DevOps工程师
宁波
薪资面谈
一周内到岗
工作经历
2023.07 - 2025.06
小楷星途科技
高级DevOps工程师

负责公司电商大促核心业务线的全链路DevOps体系建设,主导跨地域多集群(覆盖北京、上海、广州三地)的CI/CD流水线优化、混沌工程落地及资源效能提升,支撑日活5000万+用户的业务稳定性与迭代效率。

  • 针对大促期间发布频率高(日均30+次)、跨环境部署耗时长的痛点,主导重构基于Argo CD+Jenkins X的GitOps流水线,引入动态环境编排策略(通过Terraform管理测试/预发/生产环境资源),将全链路部署时间从45分钟压缩至12分钟;同步设计蓝绿发布与流量染色方案,配合Prometheus告警规则调优,将发布导致的P99延迟波动控制在50ms以内,大促期间发布成功率从92%提升至99.3%。
  • 牵头落地混沌工程实践,基于Chaos Mesh构建覆盖K8s节点故障、网络延迟、数据库主从切换的故障场景库,每月执行10+次主动注入实验;针对商品详情页服务发现的历史雪崩问题,通过模拟DNS解析延迟场景,定位到服务网格Sidecar配置冗余缺陷,优化后服务恢复时间(MTTR)从45秒降至8秒,年度故障次数同比减少67%。
  • 推动容器资源效能优化,基于Kubecost分析发现约35%的Pod存在资源超配问题,结合HPA弹性伸缩策略与QoS分级配置,重新定义CPU/Memory Request/Limit基准值;同步引入Vertical Pod Autoscaler(VPA)自动调整非核心服务资源,集群资源利用率从41%提升至68%,年云服务器成本节省约280万元。
  • 搭建研发效能度量平台,整合GitLab CI/CD、Jira、SonarQube数据,设计「部署频率」「变更失败率」「测试覆盖率」等8个DevOps核心指标看板;通过关联代码提交与线上故障数据,定位到支付模块单元测试覆盖率不足(仅52%)是缺陷逃逸主因,推动团队将测试覆盖率标准提升至75%,后续版本线上缺陷数下降42%。
2021.03 - 2023.06
小楷云联互娱
DevOps工程师

负责游戏服务器与用户中心两大业务线的DevOps工具链搭建与自动化运维,覆盖从代码提交到上线运行的全生命周期管理,支撑月活2000万+游戏的版本迭代与运维需求。

  • 主导从传统脚本运维向CI/CD标准化转型,基于GitLab CI设计分层流水线(单元测试→集成测试→容器构建→灰度发布),引入SonarLint进行代码质量门禁,将人工部署占比从70%降至15%;针对游戏服务器热更新场景,开发基于Rsync的增量包分发工具,将单服更新耗时从2分钟缩短至20秒,支持单日1000+服务器的并行更新。
  • 搭建基于Prometheus+Alertmanager的监控告警体系,自定义游戏业务指标(如在线人数波动、战斗匹配延迟),结合Grafana设计分级告警看板(P1级故障5分钟内触达责任人);通过历史数据训练异常检测模型,提前识别到数据库慢查询导致的内存泄漏风险,避免了一次可能导致全区停服的事故。
  • 推动基础设施即代码(IaC)落地,使用Terraform管理阿里云ECS、SLB、RDS资源,编写模块化配置模板(支持测试/生产环境差异化参数);同步实施基础设施健康检查脚本,每周自动扫描未绑定安全组的实例并触发告警,季度内云资源安全合规率从82%提升至98%。
  • 优化日志分析流程,基于ELK Stack构建游戏日志聚合平台,通过Filebeat采集容器日志并打标(用户ID、服务器ID、玩法类型),开发自定义Kibana仪表盘实现「战斗失败率TOP10玩法」「玩家卡顿分布」等运营关注指标的实时可视化;该平台上线后,运营反馈问题定位时间从2小时缩短至15分钟。
2019.07 - 2021.02
小楷数智起点
运维开发工程师(DevOps方向)

负责公司SaaS产品的技术支撑体系搭建,聚焦自动化运维工具开发与基础架构优化,支撑从0到1的产品迭代与客户交付(累计服务200+企业客户)。

  • 独立开发内部运维管理平台(基于Python Flask+Vue.js),集成服务器管理、任务调度、监控告警功能,替代原有的分散脚本与Excel记录;平台上线后,日常运维操作效率提升60%,客户SLA响应时间从4小时缩短至1小时,成为公司技术中台核心工具之一。
  • 解决多客户环境隔离问题,设计基于Docker Compose的客户实例快速创建方案,通过模板化docker-compose.yml文件定义Nginx、MySQL、Redis等服务依赖,实现新客户环境部署从2天缩短至2小时;同步开发环境销毁脚本,自动清理无用镜像与卷,存储成本降低40%。
  • 优化MySQL主从复制延迟问题,通过Percona Toolkit分析慢查询日志,定位到批量订单写入时的锁竞争瓶颈;优化索引策略并拆分大事务,将主从延迟从平均12秒降至2秒内,保障客户数据同步时效性,季度内客户投诉率下降55%。
  • 建立自动化巡检体系,编写Shell脚本检查服务器磁盘空间、内存使用率、进程状态等20+项指标,通过Cron定时执行并邮件推送异常;结合Zabbix实现关键指标阈值告警,全年服务器宕机事件从11次降至2次,系统可用性从99.2%提升至99.9%。
技能特长
沟通能力
执行能力
热情坦诚
文案能力
项目经验
2022.03 - 2023.08
星途互娱(上海)科技有限公司
运维开发工程师(资深)

游戏直播核心链路可观测性与自动化运维平台研发

  • 项目背景:公司游戏直播业务年增速超80%,核心链路(弹幕分发、礼物打赏、主播连麦)因多技术栈(Java gRPC、Go微服务、Redis集群、MySQL分库)割裂,故障定位平均耗时45分钟,自动化运维覆盖率仅30%,无法支撑千万级并发的大促活动需求。目标是构建“数据融合-智能诊断-自动化执行”的运维开发平台,实现核心链路故障秒级定位、常规操作全自动化。
  • 解决的关键难题:1)多源异构数据(弹幕日志、gRPC调用链、Redis命中率、MySQL慢查询)的实时关联与业务语义映射;2)高并发下自动化任务的资源隔离与幂等性保障;3)非技术运营人员对技术指标的快速理解与自助排查。
  • 核心行动与创新:1)主导采用OpenTelemetry全链路追踪标准,结合Flink实时计算引擎,将分散的数据源聚合成“直播场次-用户行为-技术服务”三维链路视图,实现弹幕发送失败可追溯至具体Redis节点或MySQL分库;2)设计基于K8s Job的自适应自动化调度器,引入分布式锁(etcd实现)与业务幂等ID,解决高并发下任务重复执行问题;3)构建业务标签体系,将“弹幕发送成功率”转化为“某场直播互动流畅度”,通过Grafana定制化Dashboard让运营人员可直接关联故障与用户体验。
  • 项目成果:平台上线后,核心链路故障定位时间缩短至8分钟内,自动化运维覆盖率提升至75%;支撑公司头部游戏直播IP周年庆活动(峰值并发1200万),期间零重大故障;平台复用率达80%,覆盖公司5条核心业务线,年节省运维人力成本约200万元。本人主导了平台架构设计与3个核心模块(数据关联引擎、自动化调度器、业务视图)的开发,推动跨研发、业务、运维团队的协同落地。
2020.07 - 2021.12
星途互娱(上海)科技有限公司
运维开发工程师

MOBA游戏服务器集群弹性伸缩与成本优化系统

  • 项目背景:公司主打MOBA游戏的匹配服务器、战斗服务器负载波动极大(周末峰值负载是平峰的3倍),此前依赖人工定时扩容,服务器闲置率达30%,月成本超500万元。目标是构建基于业务场景的自动弹性伸缩系统,实现“按需扩缩、成本最优”同时保障玩家体验(掉线率<0.1%)。
  • 解决的关键难题:1)游戏服务器负载预测的准确性(传统阈值法无法应对活动、赛季等周期性波动);2)缩容时玩家会话状态的快速迁移,避免掉线;3)弹性策略与游戏业务逻辑的解耦(不能影响战斗中的玩家会话)。
  • 核心行动与创新:1)主导引入Facebook Prophet算法,结合游戏业务的历史数据(活动日、赛季更新、周末流量)训练负载预测模型,将预测准确率从65%提升至92%;2)设计“状态同步+无缝迁移”机制,用Redis存储玩家匹配进度与会话信息,缩容前将玩家状态迁移至负载低的服务器,迁移耗时<500ms,玩家无感知;3)开发自定义K8s Metrics Adapter,将游戏业务指标(在线人数、会话时长)接入HPA,实现基于业务场景的自动伸缩。
  • 项目成果:系统上线后,服务器数量从200台缩减至120台,月成本降低35%(年节省约240万元);峰值扩容时间从10分钟缩短至2分钟,玩家掉线率从0.5%降至0.01%;支撑了公司3款MOBA游戏的服务器管理,成为集团游戏业务的通用弹性方案,复用率达100%。本人负责系统架构设计、预测模块开发及与游戏研发团队的对接,验证了技术方案与业务场景的深度融合。
奖项荣誉
  • DevOps工程师(中级)职业技能等级证书
  • 2023年度公司项目攻坚奖
  • 2024年第一季度优秀员工
自我评价
  • 深耕互联网DevOps,始终聚焦“交付效率与系统稳定平衡”,擅长从研发全链路主动识别瓶颈,推动流程向自动化、可观测进化。
  • 主导全链路自动化体系搭建,用业务语言对齐开发与运维目标,让技术改进直接支撑业务快速迭代。
  • 处理系统故障时重预防,通过复盘沉淀风险防控机制,从根源降低同类问题发生。
  • 擅长跨团队协同,以共同目标串联技术与业务诉求,推动DevOps文化从工具使用转向思维渗透。
试一下,换个颜色
选择配色
使用此模板创建简历
  • 支持电脑端、微信小程序编辑简历
  • 支持一键更换模板,自由调整字距行距
  • 支持微信分享简历给好友查看
  • 支持简历封面、自荐信、自定义简历模块
  • 支持导出为PDF、图片、在线打印、云端保存
该简历模板已内置
  • 个人名称
  • 头像
  • 基本信息
  • 求职意向
  • 工作经历
  • 项目经验
  • 实习经验
  • 作品展示
  • 奖项荣誉
  • 校园经历
  • 教育背景
  • 兴趣爱好
  • 技能特长
  • 语言能力
  • 自我评价
  • 报考信息
  • 简历封面
  • 自荐信
对话框
提示
说明