主导电商搜索系统的算法迭代与性能优化,聚焦商品召回、排序模型及用户意图识别的精准化,支撑搜索结果相关性、转化率及大促期间的系统稳定性
- 主导基于Transformer的商品标题与用户query语义匹配模型优化,针对长尾query(如“2-3岁宝宝防摔学步鞋宽头”)召回率低的问题,引入CLIP预训练模型对齐商品图文特征,结合Faiss构建“文本+图像”混合索引,将长尾query召回率从32%提升至45%,对应搜索转化率提升8%;同时通过模型量化压缩将推理耗时控制在15ms内,满足实时搜索要求
- 搭建搜索排序在线学习框架,采用LambdaRank损失函数融合实时特征(用户点击深度、加购转化率、session停留时长),替代传统离线T+1更新模式,使排序模型AUC从0.81提升至0.87,top3结果相关性评分(人工标注)提高15%;双11期间支撑12万QPS搜索请求,延迟稳定在80ms以内
- 设计搜索意图识别模块,基于BiLSTM+CRF提取query实体(品牌、年龄、功能),结合公司商品知识图谱补全隐含意图(如“婴儿奶粉”自动关联“新生儿适用”),将意图识别准确率从78%提升至89%,推动搜索结果页个性化卡片(“猜你想搜的品牌新款”)点击率提升12%
- 优化大促期间特征工程pipeline,用Spark Structured Streaming替换原有Flink任务,将实时特征计算延迟从200ms降至50ms;通过知识蒸馏将BERT-base排序模型压缩至DistilBERT,推理耗时下降40%,同时保留92%的原始模型效果