当前模板已根据「数据中心运维工程师」岗位深度优化
选择其他岗位
开始编辑模板后,您可以进一步自定义包括:工作履历、工作内容、信息模块、颜色配置等
内置经深度优化的履历,将为你撰写个人简历带来更多灵感。
陆明哲的照片
28岁
3年工作经验
13800138000
DB@zjengine.com
求职意向
数据中心运维工程师
武汉
薪资面谈
随时到岗
技能特长
沟通能力
执行能力
热情坦诚
文案能力
兴趣爱好
摄影
看书
阅读
跑步
陆明哲
责任心不是口号,而是渗透在每个工作细节中的行动准则。
工作经历
2022.07 - 2025.06
小楷云智科技有限公司
数据中心运维工程师

负责公司数据中心增值业务承载系统(企业短信、视频短信、IoT连接管理平台)的7×24小时稳定运维,涵盖服务器集群、全闪存储阵列及SDN网络的监控、故障根因分析(RCA)与性能调优;主导增值业务端到端链路保障,联动研发解决业务层与基础设施的耦合问题;推动Python/Ansible自动化工具落地,降低人工干预率;基于时间序列预测模型优化资源分配,支撑业务峰值场景的弹性供给。

  • 针对企业短信平台大促期间发送量激增(峰值达12万条/秒)导致的延迟超标问题,基于Prometheus+Grafana构建分层监控体系——新增短信队列长度、网关转发延迟等定制指标,联动SDN控制器动态调整流量路径至备用链路;同步优化Zabbix告警规则(将阈值从“队列积压>1万条”前置到“>3千条”),配合自动化脚本来回滚异常配置,最终将SLA从99.9%提升至99.99%,单次大促故障时长从2.5小时压缩至30分钟内,支撑业务峰值收入增长40%。
  • 主导开发“服务器CPU过载自愈系统”——用Python调用Ansible Tower API,结合历史负载数据训练逻辑回归模型识别异常进程,当CPU利用率连续5分钟>85%时,自动触发“降频非核心进程+弹性扩缩容”动作;覆盖了82%的常见CPU故障场景,将MTTR(平均故障恢复时间)从30分钟降至2分钟内,年节省人工排查成本约18万元。
  • 为支撑IoT连接管理平台季度30%的业务增长,用Python编写“存储资源预测模型”——基于过去12个月的IOPS、吞吐量及业务用户数数据,用ARIMA算法预测未来季度的全闪存储需求;优化采购策略后,服务器与存储的冗余率从25%降至10%,直接节省硬件成本120万元,同时确保业务峰值时存储延迟仍低于1ms。
  • 协同增值业务研发团队解决视频短信卡顿问题:用Wireshark抓包分析发现CDN节点与数据中心间的TCP重传率达15%(行业阈值<5%),定位为QoS策略未优先标记视频流;调整数据中心交换机的DSCP值为EF(Expedited Forwarding),并将TCP窗口大小从16MB扩容至32MB,最终卡顿率降至0.1%以下,用户投诉量减少72%。
2020.03 - 2022.06
小楷通信技术有限公司
数据中心运维工程师

负责数据中心基础架构(X86服务器、EMC存储、Cisco网络设备)的日常运维,支撑语音验证码、企业彩印等核心增值业务的稳定运行;参与灾备方案设计与演练,保障业务连续性;优化监控覆盖度,提升故障预警能力;协助处理重大故障,缩短恢复时间。

  • 主导灾备体系从“冷备”向“热备”转型:用VMware SRM搭建跨机房的虚拟机复制环境,制定“分钟级切换”演练流程(每月1次全链路测试),将RTO(恢复时间目标)从4小时缩短至30分钟内,助力公司通过ISO 22301业务连续性管理体系认证,成为某头部金融客户的核心供应商。
  • 重构监控体系解决存储故障漏报问题:针对原有Zabbix模板仅监控存储利用率的缺陷,自定义IOPS波动、RAID卡缓存命中率等12项关键指标,结合ELK栈分析存储设备日志;提前3次预警“存储介质坏道”隐患,避免了2次可能导致业务中断的故障,年减少业务损失约50万元。
  • 处理企业彩印系统宕机故障:夜间系统突然不可用,经Percona Toolkit分析慢查询日志,定位到数据库服务器存在内存泄漏(由第三方插件未释放缓存导致);协同研发修复插件逻辑,同时新增“内存使用率+泄漏速率”双维度监控,将MTTR从2小时压缩至40分钟,后续同类故障发生率下降90%。
  • 优化虚拟机资源利用率:用VMware vRealize Operations分析300+台虚拟机的CPU/内存利用率,整合闲置VM(原利用率<20%),将服务器平均利用率从30%提升至50%,年节省机房电力成本约35万元,同时腾出15%的机架空间支撑新业务部署。
2018.07 - 2020.02
小楷信息科技有限公司
系统运维工程师(数据中心方向)

负责数据中心服务器、网络设备的日常维护,支撑企业邮箱、呼叫中心等初期增值业务运行;执行硬件巡检与固件升级,保障基础设施可靠性;协助搭建基础监控系统,提升运维效率。

  • 搭建公司首个自动化监控系统:用Nagios+NCurses组合实现服务器CPU、内存、磁盘的实时监控,替代原有人工巡检模式;设置分级告警(邮件→短信→电话),将故障发现时间从2小时缩短至5分钟内,支撑业务从试运营到正式上线的平稳过渡。
  • 处理存储服务器RAID卡故障:某台EMC存储服务器因RAID卡电池失效导致数据读取延迟高,用厂商提供的Navisphere Manager诊断工具定位问题,30分钟内完成RAID卡更换并恢复数据,未影响企业邮箱用户的收发信功能;后续推动“RAID卡健康度月度检查”纳入运维流程,年减少存储故障10余起。
  • 完成核心设备固件升级:针对数据中心Cisco交换机频繁出现的丢包问题(丢包率1%→影响视频会议质量),下载最新IOS-XE固件,采用“滚动升级”方式替换旧版本;升级后丢包率降至0.01%以下,网络可用性从99.9%提升至99.99%,支撑呼叫中心的语音通话质量提升。
  • 编写运维知识库:整理《数据中心硬件常见故障处理手册》《服务器固件升级操作指南》等文档,覆盖80%的日常运维场景;新员工培训周期从2周缩短至5天,团队整体故障处理效率提升40%。
教育背景
2013.09 - 2016.06
XX市第一中学
理科重点班
通过系统化的数理课程训练(物理/数学竞赛班),培养了严密的逻辑思维能力和复杂问题拆解方法论;担任校科技社副社长期间,主导“简易机器人编程”项目,锻炼了技术方案落地的执行力,获省级创新大赛三等奖。
2016.09 - 2020.06
XX理工大学
计算机科学与技术(本科)
主修数据结构、算法设计等核心课程(GPA 3.7/4.0),构建系统性技术知识框架;通过校企合作项目“智慧校园小程序开发”(担任后端组长),将理论转化为高并发场景下的解决方案,服务3所高校超2万用户。获校级“技术创新标兵”(Top 5%)。
自我评价
  • 深耕电子/通信数据中心运维,以“全链路稳定性”为核心,擅长风险建模预判设备隐患,拒绝被动救火。
  • 熟悉通信级设备电、冷、网联动逻辑,能精准定位跨系统瓶颈,守牢业务连续性底线。
  • 将能耗优化植入日常运维,曾用动态制冷策略推动机房PUE降8%,用技术帮组织降本。
  • 践行“问题-根因-长效解”闭环,联动研发、供应商同步故障规律,从源头减重复问题。
语言能力
  • 英语(CET-6)
试一下,换个颜色
选择配色
使用此模板创建简历
  • 支持电脑端、微信小程序编辑简历
  • 支持一键更换模板,自由调整字距行距
  • 支持微信分享简历给好友查看
  • 支持简历封面、自荐信、自定义简历模块
  • 支持导出为PDF、图片、在线打印、云端保存
该简历模板已内置
  • 个人名称
  • 头像
  • 基本信息
  • 求职意向
  • 工作经历
  • 项目经验
  • 实习经验
  • 作品展示
  • 奖项荣誉
  • 校园经历
  • 教育背景
  • 兴趣爱好
  • 技能特长
  • 语言能力
  • 自我评价
  • 报考信息
  • 简历封面
  • 自荐信
对话框
提示
说明