当前模板已根据「数据中心运维工程师」岗位深度优化
选择其他岗位
开始编辑模板后,您可以进一步自定义包括:工作履历、工作内容、信息模块、颜色配置等
内置经深度优化的履历,将为你撰写个人简历带来更多灵感。
陆明哲的照片
陆明哲
在平凡的岗位上创造不平凡的价值,这是我的职业信仰。
28岁
3年工作经验
13800138000
DB@zjengine.com
求职意向
数据中心运维工程师
武汉
薪资面谈
一个月内到岗
工作经历
2022.07 - 2025.06
小楷云智科技有限公司
数据中心运维工程师

负责公司数据中心增值业务承载系统(企业短信、视频短信、IoT连接管理平台)的7×24小时稳定运维,涵盖服务器集群、全闪存储阵列及SDN网络的监控、故障根因分析(RCA)与性能调优;主导增值业务端到端链路保障,联动研发解决业务层与基础设施的耦合问题;推动Python/Ansible自动化工具落地,降低人工干预率;基于时间序列预测模型优化资源分配,支撑业务峰值场景的弹性供给。

  • 针对企业短信平台大促期间发送量激增(峰值达12万条/秒)导致的延迟超标问题,基于Prometheus+Grafana构建分层监控体系——新增短信队列长度、网关转发延迟等定制指标,联动SDN控制器动态调整流量路径至备用链路;同步优化Zabbix告警规则(将阈值从“队列积压>1万条”前置到“>3千条”),配合自动化脚本来回滚异常配置,最终将SLA从99.9%提升至99.99%,单次大促故障时长从2.5小时压缩至30分钟内,支撑业务峰值收入增长40%。
  • 主导开发“服务器CPU过载自愈系统”——用Python调用Ansible Tower API,结合历史负载数据训练逻辑回归模型识别异常进程,当CPU利用率连续5分钟>85%时,自动触发“降频非核心进程+弹性扩缩容”动作;覆盖了82%的常见CPU故障场景,将MTTR(平均故障恢复时间)从30分钟降至2分钟内,年节省人工排查成本约18万元。
  • 为支撑IoT连接管理平台季度30%的业务增长,用Python编写“存储资源预测模型”——基于过去12个月的IOPS、吞吐量及业务用户数数据,用ARIMA算法预测未来季度的全闪存储需求;优化采购策略后,服务器与存储的冗余率从25%降至10%,直接节省硬件成本120万元,同时确保业务峰值时存储延迟仍低于1ms。
  • 协同增值业务研发团队解决视频短信卡顿问题:用Wireshark抓包分析发现CDN节点与数据中心间的TCP重传率达15%(行业阈值<5%),定位为QoS策略未优先标记视频流;调整数据中心交换机的DSCP值为EF(Expedited Forwarding),并将TCP窗口大小从16MB扩容至32MB,最终卡顿率降至0.1%以下,用户投诉量减少72%。
2020.03 - 2022.06
小楷通信技术有限公司
数据中心运维工程师

负责数据中心基础架构(X86服务器、EMC存储、Cisco网络设备)的日常运维,支撑语音验证码、企业彩印等核心增值业务的稳定运行;参与灾备方案设计与演练,保障业务连续性;优化监控覆盖度,提升故障预警能力;协助处理重大故障,缩短恢复时间。

  • 主导灾备体系从“冷备”向“热备”转型:用VMware SRM搭建跨机房的虚拟机复制环境,制定“分钟级切换”演练流程(每月1次全链路测试),将RTO(恢复时间目标)从4小时缩短至30分钟内,助力公司通过ISO 22301业务连续性管理体系认证,成为某头部金融客户的核心供应商。
  • 重构监控体系解决存储故障漏报问题:针对原有Zabbix模板仅监控存储利用率的缺陷,自定义IOPS波动、RAID卡缓存命中率等12项关键指标,结合ELK栈分析存储设备日志;提前3次预警“存储介质坏道”隐患,避免了2次可能导致业务中断的故障,年减少业务损失约50万元。
  • 处理企业彩印系统宕机故障:夜间系统突然不可用,经Percona Toolkit分析慢查询日志,定位到数据库服务器存在内存泄漏(由第三方插件未释放缓存导致);协同研发修复插件逻辑,同时新增“内存使用率+泄漏速率”双维度监控,将MTTR从2小时压缩至40分钟,后续同类故障发生率下降90%。
  • 优化虚拟机资源利用率:用VMware vRealize Operations分析300+台虚拟机的CPU/内存利用率,整合闲置VM(原利用率<20%),将服务器平均利用率从30%提升至50%,年节省机房电力成本约35万元,同时腾出15%的机架空间支撑新业务部署。
2018.07 - 2020.02
小楷信息科技有限公司
系统运维工程师(数据中心方向)

负责数据中心服务器、网络设备的日常维护,支撑企业邮箱、呼叫中心等初期增值业务运行;执行硬件巡检与固件升级,保障基础设施可靠性;协助搭建基础监控系统,提升运维效率。

  • 搭建公司首个自动化监控系统:用Nagios+NCurses组合实现服务器CPU、内存、磁盘的实时监控,替代原有人工巡检模式;设置分级告警(邮件→短信→电话),将故障发现时间从2小时缩短至5分钟内,支撑业务从试运营到正式上线的平稳过渡。
  • 处理存储服务器RAID卡故障:某台EMC存储服务器因RAID卡电池失效导致数据读取延迟高,用厂商提供的Navisphere Manager诊断工具定位问题,30分钟内完成RAID卡更换并恢复数据,未影响企业邮箱用户的收发信功能;后续推动“RAID卡健康度月度检查”纳入运维流程,年减少存储故障10余起。
  • 完成核心设备固件升级:针对数据中心Cisco交换机频繁出现的丢包问题(丢包率1%→影响视频会议质量),下载最新IOS-XE固件,采用“滚动升级”方式替换旧版本;升级后丢包率降至0.01%以下,网络可用性从99.9%提升至99.99%,支撑呼叫中心的语音通话质量提升。
  • 编写运维知识库:整理《数据中心硬件常见故障处理手册》《服务器固件升级操作指南》等文档,覆盖80%的日常运维场景;新员工培训周期从2周缩短至5天,团队整体故障处理效率提升40%。
实习经验
2019.03 - 2019.06
小楷网络
行业研究实习生
  1. 深度行业洞察:独立完成新能源汽车电池产业链研究,覆盖15家上市公司财务数据,通过成本结构分析精准预判2家供应商涨价空间(后续3个月验证准确率100%);
  2. 决策支持工具:搭建“政策-技术-市场”三维评估模型,辅助投资团队筛选出3个标的项目(1个进入尽调阶段);
  3. 资源整合突破:通过专家访谈获取关键上游材料产能数据,填补原数据库30%信息缺口,报告被合伙人批注“具备买方思维”。
技能特长
沟通能力
执行能力
热情坦诚
文案能力
奖项荣誉
  • 数据中心基础设施运维技能等级证书(中级)
  • 2023年度公司优秀运维工程师
  • 2023年市级数据中心运维技能竞赛三等奖
自我评价
  • 深耕电子/通信行业数据中心运维,熟稔通信设备与IT基建协同逻辑,具备全生命周期运维统筹能力。
  • 擅长用故障树分析法挖根源,推动建预防机制,降重复故障率。
  • 主动聚焦资源利用率与能耗优化,通过动态调度支撑业务扩容适配。
  • 习惯以技术语言衔接跨团队诉求,前置识别风险保服务连续性。
试一下,换个颜色
选择配色
使用此模板创建简历
  • 支持电脑端、微信小程序编辑简历
  • 支持一键更换模板,自由调整字距行距
  • 支持微信分享简历给好友查看
  • 支持简历封面、自荐信、自定义简历模块
  • 支持导出为PDF、图片、在线打印、云端保存
该简历模板已内置
  • 个人名称
  • 头像
  • 基本信息
  • 求职意向
  • 工作经历
  • 项目经验
  • 实习经验
  • 作品展示
  • 奖项荣誉
  • 校园经历
  • 教育背景
  • 兴趣爱好
  • 技能特长
  • 语言能力
  • 自我评价
  • 报考信息
  • 简历封面
  • 自荐信
对话框
提示
说明