负责电商平台全链路搜索算法设计,涵盖召回策略迭代、多目标排序模型优化、用户意图理解及线上AB实验落地,边界覆盖特征工程到高并发服务部署,需平衡用户体验与GMV核心指标。
- 主导召回层多模态融合策略升级,针对长尾查询召回不足问题,基于双塔模型(DSSM改进版)强化商品标题与用户查询的语义对齐,同步引入图神经网络(GNN)挖掘商品类目-属性-品牌的关联关系,构建‘语义+图关系’双路召回;通过离线对比实验调整两路权重,线上AB测试显示CTR提升8.2%,长尾查询GMV贡献占比从12%增至17%。
- 重构排序模型特征体系,针对用户行为稀疏性问题,采用Transformer编码器处理用户7天实时行为序列(点击/加购/收藏),融合上下文特征(时段、设备、促销标签)与商品侧深度特征(价格带、库存状态),并通过知识蒸馏将教师模型(DeepFM)能力迁移至轻量学生模型;线上AUC从0.78提升至0.81,转化率提升3.1%,模型推理耗时降低25%。
- 牵头模糊意图识别模块优化,基于BERT-base微调处理‘送男友礼物’‘学生党平价护肤品’等无明确品类指向的查询,结合自研商品知识图谱补全实体标签(如‘礼物’关联‘饰品/数码’),设计意图分类-实体补全-查询扩展三阶段流程;意图准确率从85%提升至92%,无效查询截断率下降12%,相关查询的点击深度提升1.5次。
- 推动搜索系统性能升级,基于Flink实现用户行为特征实时入湖(Hudi),替代原有T+1离线计算;同步优化TensorFlow Serving部署架构,采用动态批处理与模型量化,将排序响应时间从120ms压缩至80ms,支撑大促期间峰值QPS 5万+的稳定运行,系统可用性保持99.99%。