负责电商平台商品视觉理解与内容审核算法全生命周期研发,覆盖需求拆解、模型设计、优化落地及效果迭代全流程,支撑商品图合规性校验与用户体验提升
- 主导设计基于Transformer的多模态商品图违规检测模型,融合ResNet-50骨干网络提取视觉特征与BERT编码商品标题/描述文本语义,针对低光照、模糊商品图的漏检痛点,引入CBAM注意力机制强化商品主体区域特征权重,将违规识别准确率从89%提升至96%,日均处理120万张商品图,支撑618大促期间平台内容合规率100%,未因视觉违规引发客诉
- 核心参与构建服饰类商品风格细粒度分类体系,基于CLIP模型实现文本-图像跨模态对齐,针对“新中式”“极简风”等风格歧义问题,设计多尺度特征融合模块(融合ConvNeXt的浅层细节与ViT的深层语义),将风格分类F1-score从0.82提升至0.91,助力运营团队精准推送风格化商品,对应类目转化率提升15%
- 优化模型推理效率以应对高并发审核场景,采用TensorRT对YOLOv8目标检测模型进行FP16量化与层融合,将模型体积缩小40%、推理延迟从120ms降至75ms,在保证检测精度(mAP@0.5保持92%)的前提下,支撑大促峰值2万QPS的实时审核需求,服务器GPU成本降低25%
- 搭建视觉算法效果监控体系,基于Prometheus+Grafana实现模型准确率、推理延迟、GPU利用率等12项指标实时监控,结合A/B测试框架验证算法迭代效果,将模型从需求到上线周期从2周缩短至1周,快速响应平台“禁止过度暴露”等规则变更,迭代效率提升50%