负责电商平台全链路搜索算法设计与优化,覆盖query理解、召回、排序及重排全流程,联动业务目标(点击率、转化率、GMV)与用户体验提升,支撑大促及日常搜索场景的高并发与精准匹配
- 主导设计基于多模态融合的商品query理解模型,针对用户长尾query(如“夏季通勤薄款连衣裙显瘦”)语义模糊问题,结合BERT-base预训练模型与电商垂域语料(爬取10万+商品标题+用户评价)微调,引入商品属性图谱(涵盖品牌、风格、材质等12类实体)的实体链接技术,将query意图识别准确率从82%提升至91%,直接带动搜索页点击率提升3.8%(A/B测试样本量500万+UV)
- 重构搜索召回层策略,融合传统ItemCF协同过滤与深度学习召回(DIN用户兴趣网络、DIEN行为序列网络),构建“兴趣扩展+场景适配”双路召回架构——兴趣路基于用户历史行为扩展关联商品,场景路结合当前时段(如早8点推早餐食品)、设备(移动端推短描述商品)调整召回权重,解决冷启动用户(注册1周内)召回多样性不足问题,召回集相关度提升27%,新用户首单转化率从11%升至15%
- 优化排序模型性能,基于“Wide&Deep+XGBoost”组合架构,融入用户实时行为特征(如最近30分钟浏览时长、加购商品价格带)与商品实时状态(库存预警、限时促销折扣),通过离线多目标优化(同时最大化点击与GMV)调参,排序模型AUC从0.85提升至0.89,搜索场景GMV贡献占比从28%提升至34%(大促期间单日贡献超2000万GMV)
- 推动搜索系统实时化改造,采用Flink搭建实时特征计算pipeline,将用户最新点击/加购行为反馈至排序模型的延迟从60秒压缩至5秒内,结合TensorFlow Serving在线学习框架实现模型小时级更新,应对双11期间流量峰值(QPS从平时1万升至10万),大促期间搜索转化率较去年同期提升5.2%,未出现因模型延迟导致的流量流失