负责直播业务全链路性能测试体系搭建与迭代,聚焦高并发场景下的性能瓶颈定位、容量规划及稳定性保障,支撑千万级DAU直播活动的全链路性能健康度
- 主导设计直播推流-转码-分发-播放全链路性能测试模型,基于JMeter分布式压测框架+Grafana监控平台构建业务级压测场景,模拟10万+并发推流请求;通过Linux火焰图分析发现转码服务CPU利用率瓶颈(峰值92%),推动后端优化Java线程池参数(将核心线程数从20调整至32)与启用AVX-512指令集并行计算,单节点转码吞吐量从1200路/分钟提升至2100路/分钟,支撑双11直播推流成功率从98.2%提升至99.6%
- 牵头直播观看端弱网性能专项,使用Charles模拟2G/3G/4G网络环境(丢包率10%-30%、延迟500ms-2s),结合PerfMon监控客户端CPU/内存占用;定位到播放器缓冲区策略僵化问题,优化自适应码率切换算法(将码率调整阈值从±20%缩小至±5%)与动态扩容逻辑(按当前带宽的1.5倍预加载),弱网下卡顿率从15%降至4%,用户30分钟留存率提升8%
- 搭建直播业务容量规划模型,基于历史流量数据与压测结果,用Python线性回归分析预测峰值QPS;推动基础设施团队提前扩容CDN边缘节点30个、转码集群EC2实例50台,保障春节直播峰值并发观看1200万人时,页面加载时间稳定在1.5s内,无超时报错
- 主导性能测试流程标准化,编写《直播业务性能测试规范》《性能瓶颈定位手册》,引入SonarQube对性能测试代码进行静态扫描(修复率100%);培养2名初级性能测试工程师,输出3篇内部技术分享(覆盖弱网测试工具链、全链路压测场景设计),团队测试效率提升40%