负责电信增值业务核心软件系统的全生命周期开发与运维,聚焦短信/彩信网关平台、用户行为分析系统及计费支撑模块,协同产品、测试团队完成需求落地与稳定性保障,主导关键技术攻关与性能优化。
- 主导短信网关系统从单体架构向Spring Cloud微服务架构的迁移,针对原系统QPS峰值仅8000的瓶颈,设计基于Nacos的服务注册中心与Sentinel流量控制方案,拆分出协议解析、路由分发、状态回调3个核心服务,引入Redis分布式锁解决并发写冲突,最终系统QPS提升至2.5万,故障恢复时间从小时级缩短至5分钟内,支撑了双11期间单日12亿条短信的高并发处理。
- 优化用户鉴权模块性能,针对旧版RSA加密+数据库查询导致的单次鉴权耗时200ms问题,采用SM4国密算法替换RSA降低计算开销,同步引入本地缓存Caffeine存储高频用户鉴权信息(TTL设置30分钟),并通过异步线程池更新缓存,将鉴权耗时压缩至30ms以内,月均减少数据库查询量4500万次,系统资源占用下降28%。
- 设计并实现增值业务实时监控告警系统,基于Prometheus采集网关、分析平台等6个系统的300+指标,结合Grafana搭建可视化看板,自定义阈值规则(如消息丢失率>0.1%、接口错误率>1%触发告警),配套开发钉钉机器人自动推送与工单联动功能,故障发现时效从平均15分钟缩短至3分钟,全年重大事故率同比下降65%。
- 牵头解决跨系统数据一致性难题,针对短信发送与用户消费记录同步不同步问题,引入Seata分布式事务框架,在订单创建、消息发送、消费扣费3个关键节点配置AT模式事务,配合Canal监听MySQL binlog校验数据差异,实现端到端数据一致率从98.2%提升至99.98%,月均修正不一致数据从12万条降至200条以内。