当前模板已根据「云平台运维工程师」岗位深度优化
选择其他岗位
开始编辑模板后,您可以进一步自定义包括:工作履历、工作内容、信息模块、颜色配置等
内置经深度优化的履历,将为你撰写个人简历带来更多灵感。
陆明哲
在平凡的岗位上创造不平凡的价值,这是我的职业信仰。
28岁
3年工作经验
13800138000
DB@zjengine.com
陆明哲的照片
求职意向
云平台运维工程师
北京
薪资面谈
随时到岗
工作经历
2023.07 - 至今
小楷云链科技有限公司
云平台运维工程师

主导公有云(阿里云+腾讯云混合部署)平台稳定性运营、资源效能优化及自动化运维体系落地,对接电商、金融两条业务线的云服务需求,保障核心交易链路99.99%可用性

  • 大促期间主导核心交易链路稳定性保障:针对电商业务双11流量洪峰(预估QPS峰值12万),提前30天用阿里云ARMS、腾讯云CLB做全链路压测,发现某核心订单服务因RDS MySQL连接池参数不合理导致偶发耗尽——通过分析慢查询日志(pt-query-digest工具),调整`wait_timeout`至300秒并新增联合索引,同时用Chaos Mesh注入“数据库连接超时”故障演练,验证熔断机制有效性;大促期间该服务响应时间从200ms降至120ms,零故障支撑1.2亿订单量。
  • 资源利用率优化项目:针对闲置ECS实例(月均闲置率15%)和冗余OSS存储(冷数据占比20%),开发Python脚本结合阿里云成本管家、腾讯云费用中心做资源画像,分类标注“连续7天CPU利用率<10%”的实例,推动业务团队迁移至弹性伸缩组(AS)并绑定Spot实例;最终年度云成本下降18%,闲置资源率降至3%,释放成本约240万元。
  • 自动化资源编排体系搭建:替代手动创建云资源的低效流程,基于Terraform+Ansible构建“环境-资源”联动编排框架——用Terraform Workspaces管理开发/测试/生产环境变量,Ansible Vault加密敏感信息(如AK/SK),并将资源创建流程嵌入Jenkins Pipeline;实现EC2实例、RDS数据库、SLB负载均衡的全自动化交付,资源交付时间从4小时缩短至15分钟,人为配置错误率从8%降至0.5%。
  • 云原生迁移推动:主导 legacy 电商库存系统从虚拟机迁移至阿里云ACK容器集群——解决应用依赖特定Linux内核模块(`kernel-headers-3.10.0`)的兼容性问题,协同研发重构镜像为多阶段构建(Multi-stage Build),移除冗余依赖;迁移后部署密度提升3倍(单节点承载Pod从5个到15个),资源利用率从40%升至65%,发布频率从每周1次提升至每日3次。
2021.03 - 2023.06
小楷互联科技有限公司
高级云运维工程师

负责私有云(OpenStack)与公有云(华为云)混合云平台运维,支撑短视频业务的存储、计算及内容分发需求,保障视频上传-转码-播放全流程99.995%可用性

  • 混合云网络性能优化:针对跨云(华为云OBS存储→阿里云CDN分发)的视频转码任务延迟高问题(原500ms),用iperf3测试链路带宽,发现VPC peering路由策略冗余——调整路由表将转码流量定向至华为云高速通道,同时开启BGP Anycast优化;最终跨云API调用延迟降至150ms,单条视频转码完成时间缩短25%,支撑日均1000万条视频处理。
  • OpenStack存储稳定性修复:解决Cinder卷挂载失败问题(月均3次),分析GlusterFS后端日志发现副本同步超时——升级GlusterFS至v10.8,调整副本数从2到3并启用`gluster volume heal`自动修复,同时用Prometheus+Grafana搭建存储监控看板(采集`gluster_volume_status`等指标),设置“卷挂载失败率>0.1%”告警;后续卷挂载失败率降至0,存储可用性提升至99.995%。
  • 自动化故障诊断工具开发:针对OpenStack实例启动失败(常见原因:镜像损坏、资源配额不足),用Python+OpenStack SDK开发工具,整合ELK Stack日志收集与Ceilometer指标分析——自动提取“ImageNotFound”“QuotaExceeded”等关键字,输出故障根因报告;故障排查时间从1小时缩短至15分钟,运维效率提升70%。
  • 公有云存储成本管控:针对华为云OBS冗余数据问题(冷视频缩略图占比18%),启用OBS生命周期管理(Lifecycle Management),将30天以上数据自动归档至低频存储(Infrequent Access),并协同研发优化缩略图生成策略(从“每日全量生成”改为“用户请求时按需生成”);最终OBS存储成本下降22%,年节省约80万元。
2019.07 - 2021.02
小楷在线科技有限公司
云运维工程师

负责电商业务公有云(AWS)平台日常运维,支撑商品详情页、购物车等核心系统7x24小时运行,保障大促期间系统吞吐量满足业务增长需求

  • 大促故障应急处理:某次AWS us-east-1区域EC2实例大规模重启(因底层主机硬件故障),快速触发Auto Scaling Group自动替换实例,同时通过Route53将流量切换至us-west-2备用区域;配合研发团队切换缓存集群(从Memcached到ElastiCache),故障恢复时间控制在30分钟内,未影响用户访问,订单成功率保持在99.9%以上。
  • 监控体系从0到1搭建:基于CloudWatch+X-Ray构建核心系统监控体系——采集CPU、内存、磁盘IO及接口响应时间(如商品详情页`GET /item/{id}`)等20+指标,设置“CPU利用率>80%”触发ASG扩容、“接口延迟>500ms”触发告警;系统预警准确率提升至95%,提前发现并解决3起因数据库慢查询导致的性能瓶颈。
  • 自动化备份脚本开发:替代人工RDS备份流程,编写Shell脚本结合AWS S3做增量备份——利用`mysqldump`导出逻辑备份,上传至S3并设置“7天滚动删除”策略;备份成功率从90%升至100%,恢复时间从2小时缩短至30分钟,满足RPO<15分钟的业务要求。
  • 大促容量规划与优化:支撑618大促上线,用AWS Compute Optimizer分析历史负载,将通用型实例(t3.large)替换为计算优化型(c5.large),提升单实例QPS 40%;同时开启RDS只读副本分担读流量,大促期间系统吞吐量提升40%,商品详情页响应时间稳定在300ms以内。
技能特长
沟通能力
执行能力
热情坦诚
文案能力
兴趣爱好
摄影
看书
阅读
跑步
自我评价
  • 深耕互联网云运维6年,打通架构部署到容量管理全链路,习惯以业务峰值场景锚定平台韧性,前置规避大促级稳定性风险。
  • 故障处理坚持“根因-闭环-沉淀”,用自动化框架压MTTR至10分钟内,更推动团队建案例库降重复问题30%。
  • 对云成本敏感,能结合业务流量配弹性策略,帮前司年省18%且不影响体验。
  • 跨团队偏好“业务语言对齐”,把云价值转成产品、运营支撑点,让技术更贴业务目标。
  • INTEGRITY
    信守承诺,基石所在
  • AGILITY
    敏捷进化,适应未来
  • SYNERGY
    聚力协同,创造共赢
试一下,换个颜色
选择配色
使用此模板创建简历
  • 支持电脑端、微信小程序编辑简历
  • 支持一键更换模板,自由调整字距行距
  • 支持微信分享简历给好友查看
  • 支持简历封面、自荐信、自定义简历模块
  • 支持导出为PDF、图片、在线打印、云端保存
该简历模板已内置
  • 个人名称
  • 头像
  • 基本信息
  • 求职意向
  • 工作经历
  • 项目经验
  • 实习经验
  • 作品展示
  • 奖项荣誉
  • 校园经历
  • 教育背景
  • 兴趣爱好
  • 技能特长
  • 语言能力
  • 自我评价
  • 报考信息
  • 简历封面
  • 自荐信
对话框
提示
说明