当前模板已根据「数据库管理员 (DBA)」岗位深度优化
选择其他岗位
开始编辑模板后,您可以进一步自定义包括:工作履历、工作内容、信息模块、颜色配置等
内置经深度优化的履历,将为你撰写个人简历带来更多灵感。
陆明哲的照片
28岁
3年工作经验
13800138000
DB@zjengine.com
求职意向
数据库管理员 (DBA)
宁波
薪资面谈
一个月内到岗
技能特长
沟通能力
执行能力
热情坦诚
文案能力
兴趣爱好
摄影
看书
阅读
跑步
陆明哲
在平凡的岗位上创造不平凡的价值,这是我的职业信仰。
工作经历
2026.04 - 至今
小楷科技
高级数据库管理员(DBA)

负责公司核心交易、用户行为、日志三大类数据库集群的全生命周期管理,主导分布式数据库架构升级与自动化运维体系搭建,统筹跨部门数据库技术协作,保障日均10亿+请求、PB级数据量的数据库集群稳定性与成本效率。

  • 主导完成MySQL向TiDB的分布式架构迁移项目:针对电商大促期间单库QPS突破8万导致的性能瓶颈,通过分析sysbench压测报告与慢查询日志(使用pt-query-digest定位TOP 100慢SQL),设计分库分表策略并重构应用连接池逻辑,迁移过程采用TiDB Lightning离线导入+增量Binlog同步方案,实现零数据丢失;迁移后集群读写QPS峰值提升至15万,存储成本降低40%,大促期间故障率从0.8%降至0.1%。
  • 构建数据库自动化运维平台:基于Python开发部署脚本(集成Ansible Tower),实现从实例创建、参数配置、备份恢复到监控告警的全流程自动化;对接Prometheus+Grafana监控体系,自定义30+核心指标(如InnoDB Buffer Pool命中率、锁等待时长),结合机器学习算法预测容量峰值,提前72小时触发扩容提醒,全年避免因资源不足导致的业务中断事件12起。
  • 优化多活容灾架构:针对华东-华南双数据中心同步延迟问题(原平均50ms),通过调整TiKV Region分裂策略与Raft Group副本分布,结合Zabbix自定义告警规则(设置延迟阈值30ms触发熔断),将同步延迟稳定控制在10ms以内;主导完成两地三中心容灾演练,RTO从2小时缩短至15分钟,RPO从5分钟降至30秒,通过信通院数据库容灾能力四级认证。
  • 制定数据库开发规范与培训体系:梳理《慢查询优化手册》《索引设计指南》等6份技术文档,组织跨部门技术培训20场,推动业务侧SQL写合规率从65%提升至92%;建立SQL审核平台(集成Yearning),拦截高危操作(如无索引全表扫描、大事务)占比从35%降至8%,年减少生产环境故障30+次。
2024.09 - 2026.03
小楷数科
中级数据库管理员(DBA)

负责金融支付、会员服务两条核心业务线的数据库运维,支撑日活500万用户的交易与数据查询需求,重点推进数据库高可用改造与性能调优,保障SLA全年99.99%。

  • 完成支付核心库从单集群到主备+读写分离架构升级:针对支付回调接口响应超时问题(原P99延迟200ms),分析发现从库负载不均衡(热点更新导致),通过调整GTID复制拓扑为级联复制,结合ProxySQL动态路由读请求,将主库CPU使用率从85%降至60%,接口P99延迟优化至80ms以内,支撑双11支付峰值1.2万笔/秒。
  • 解决历史数据归档与查询性能矛盾:会员行为日志库累计数据量达800TB,常规查询耗时超30秒;设计冷热数据分层方案(使用TiDB TiFlash列存引擎存储历史数据),结合CronJob定时任务将3年以上数据迁移至归档库,查询平均耗时降至5秒内,同时节省主库存储成本35%。
  • 主导数据库监控体系重构:替换原有Zabbix监控为Open-Falcon+Prometheus混合架构,新增InnoDB死锁检测、临时表使用量等20+关键指标,通过Grafana定制业务看板(如订单成功率关联数据库锁等待时长),实现故障根因定位时间从40分钟缩短至10分钟,全年重大故障响应效率提升70%。
  • 推动数据库安全合规建设:梳理《敏感数据访问规范》,通过MySQL Enterprise Audit插件监控高危操作(如DROP TABLE、导出全表数据),结合Vault管理数据库账号密码,完成等保三级测评中数据库安全项零缺陷通过;全年拦截未授权数据查询事件5起,避免用户隐私泄露风险。
2022.07 - 2024.08
小楷电商
初级数据库管理员(DBA)

负责电商主站商品、订单、促销活动三类MySQL数据库的日常运维,支撑日均300万UV的业务需求,重点完成数据库日常监控、故障排查与基础优化,保障系统7×24小时稳定运行。

  • 搭建数据库基础监控体系:使用Nagios+Percona Monitoring and Management(PMM)部署监控节点,配置QPS、连接数、慢查询数等15项核心指标告警阈值,结合企业微信机器人实现7×24小时告警推送;上线首月即捕获3次主库连接数暴涨事件(因业务代码未释放连接),通过调整wait_timeout参数与增加连接池最大连接数,避免业务中断。
  • 优化大促期间数据库性能:针对618大促前商品详情页查询QPS预计增长200%的问题,使用sysbench模拟压测发现InnoDB Buffer Pool命中率仅65%,通过扩容Buffer Pool大小(从64G调整至128G)与优化热点商品缓存策略(将TOP 1000商品缓存至Redis),大促期间查询响应时间稳定在200ms内,未出现超时告警。
  • 解决慢查询导致的数据库负载过高:通过pt-query-digest分析慢查询日志,定位到订单列表接口存在无索引的全表扫描SQL(执行耗时超5秒),协调开发团队添加复合索引(覆盖order_status、create_time字段),优化后该SQL执行时间降至50ms内,主库CPU使用率从75%降至55%,月均慢查询量下降80%。
  • 完成数据库备份策略优化:原全量备份每日1次(耗时4小时)+ 增量备份每小时1次,占用存储空间3TB/月;调整为基于Binlog的物理备份(使用Percona XtraBackup),结合Restic压缩归档,将备份时间缩短至1.5小时,月存储成本降低50%,同时验证备份恢复RTO≤2小时,满足业务容灾要求。
项目经验
2022.05 - 2023.10
星途互娱(专注游戏分发与社交娱乐的互联网企业)
运维开发工程师(核心研发负责人)

游戏分发平台全链路运维自动化平台研发及规模化落地

  • 项目背景:星途互娱游戏分发平台承载亿级用户日常访问,原有运维体系依赖分散的Shell脚本与人工操作,存在部署耗时久(单次全量部署需4小时)、故障定位慢(平均30分钟/次)、容量规划靠经验等问题,严重影响业务迭代效率与用户体验。核心目标是通过全链路自动化平台实现“部署-监控-故障自愈-容量管理”闭环,支撑平台高并发与快速迭代需求。我的职责是主导平台整体架构设计、关键模块开发及跨团队落地推动。
  • 关键难题:1)平台需兼容物理机、虚拟机、K8s容器等多异构环境,原有监控数据分散在不同系统,难以统一关联分析;2)故障自愈需基于多维度数据(metrics/logs/traces)快速定位根因并执行修复,现有规则引擎缺乏业务场景适配性;3)容量规划需精准预测业务峰值(如新游上线、周末活动)带来的资源需求,传统线性预测模型误差率超30%。
  • 核心行动与创新:1)设计“统一数据层+场景化引擎”架构:整合Prometheus(监控)、ELK(日志)、Jaeger(链路追踪)数据至ClickHouse,构建全链路数据湖;针对游戏业务周期性特点,基于XGBoost模型融合历史流量、活动排期、用户行为数据,开发动态容量预测模块,将误差率降至8%以内;2)故障自愈引擎引入“规则+机器学习”双决策模式:通过规则引擎处理常见故障(如Pod重启、磁盘满),用LSTM模型识别异常流量模式(如DDoS前兆),自动触发对应修复动作(如扩容、流量切换);3)主导开发部署流水线模块,支持蓝绿部署、灰度发布等策略,集成健康检查与回滚机制,确保发布安全。
  • 项目成果:平台上线后,全量部署时间从4小时缩短至15分钟,故障定位时间降至5分钟内,容量利用率提升20%;支撑平台完成12次大型版本迭代与6次峰值流量考验(最高QPS达800万),未发生因运维问题导致的业务宕机。我个人主导了平台核心功能研发,推动开发、测试、产品团队协同,确保平台覆盖80%以上运维场景,年节省运维人力成本约30万元。
2020.08 - 2022.04
星途互娱
运维开发工程师(中级)

游戏CDN节点智能运维系统研发及故障降本

  • 项目背景:星途互娱拥有2000+分布在北上广深及海外地区的CDN节点,原有运维模式依赖人工巡检与告警阈值触发,存在无效告警率高(日均120条,有效率仅40%)、故障排查耗时久(平均25分钟/节点)等问题,导致节点 downtime 每月超10小时,影响用户下载速度与播放体验。我的职责是负责故障诊断与智能告警模块的研发,支撑系统实现“精准告警-根因定位-自动修复”能力。
  • 关键难题:1)CDN节点日志量大(单节点日均产生5GB访问日志),传统ELK检索效率低,难以快速提取故障特征;2)不同节点的故障场景差异大(如海外节点网络波动、国内节点带宽拥塞),通用规则引擎无法适配;3)告警阈值设置依赖经验,容易出现“狼来了”效应,导致运维人员忽略关键告警。
  • 核心行动与创新:1)开发日志聚合分析模块:用Fluentd收集CDN节点日志,通过Elasticsearch的索引优化(如按地域、节点类型分词)与Kibana的可视化仪表盘,实现日志的快速检索与特征提取;2)构建场景化故障诊断模型:针对海外节点,用关联规则挖掘网络延迟与丢包率的相关性,识别跨境链路故障;针对国内节点,基于决策树模型分析带宽利用率与请求成功率的关系,定位拥塞源;3)实现告警分级与降噪:通过机器学习模型对告警进行优先级排序,将无效告警过滤率提升至70%,同时推送关键告警至运维人员的钉钉/企业微信,附带根因分析与修复建议。
  • 项目成果:系统上线后,CDN节点故障 downtime 每月降至6小时以内,无效告警数量减少60%,运维人员处理单节点故障的时间从25分钟缩短至8分钟;年节省故障处理成本约20万元,同时提升了用户下载成功率达15%。我主导了故障诊断模块的研发,优化了日志处理流程,推动与CDN厂商的API对接,实现部分故障的自动修复(如重启边缘节点)。
教育背景
2013.09 - 2016.06
XX外国语学校
文科重点班(英语特长)
强化英语沟通能力(雅思7.0),建立跨文化协作基础;策划“模拟世界经济论坛”活动,主导团队完成10国经济政策分析报告,培养全球化商业视野与数据分析敏感度。
2016.09 - 2020.06
XX财经大学
金融学(本科)
聚焦公司金融与量化分析课程(GPA 3.8/4.0),掌握风险评估与资本运作模型;在XX证券实习期间,独立完成5家上市公司财报横向对比研究,提出的“现金流健康度评估指标”被部门采纳为风控补充工具。获CFA协会投资分析大赛华东区8强。
奖项荣誉
  • 数据库系统工程师
  • 2023年度公司优秀DBA
  • 2022年公司数据库性能优化竞赛一等奖
自我评价
  • 深耕互联网数据库全生命周期管理,以业务峰值稳定性为核心,习惯用「业务影响倒推」预判风险,平衡可用性与扩展性。
  • 擅长索引调优、慢查询治理等性能优化,将「主动防御」融入日常运维,减少突发故障对业务的影响。
  • 能与开发、产品同频对话,把技术语言转化为业务价值,推动解决数据一致性与迭代效率的矛盾。
  • 紧跟云原生、分布式技术趋势,主动沉淀方法论赋能团队,助力组织数据库能力持续升级。
试一下,换个颜色
选择配色
使用此模板创建简历
  • 支持电脑端、微信小程序编辑简历
  • 支持一键更换模板,自由调整字距行距
  • 支持微信分享简历给好友查看
  • 支持简历封面、自荐信、自定义简历模块
  • 支持导出为PDF、图片、在线打印、云端保存
该简历模板已内置
  • 个人名称
  • 头像
  • 基本信息
  • 求职意向
  • 工作经历
  • 项目经验
  • 实习经验
  • 作品展示
  • 奖项荣誉
  • 校园经历
  • 教育背景
  • 兴趣爱好
  • 技能特长
  • 语言能力
  • 自我评价
  • 报考信息
  • 简历封面
  • 自荐信
对话框
提示
说明