负责电商平台全链路搜索算法设计、迭代与落地,覆盖召回、排序、重排核心环节,目标是通过用户意图精准匹配与商品价值排序,提升搜索GMV占比及用户点击率(CTR)。
- 主导召回层多模态融合优化,针对传统协同过滤对长尾商品覆盖不足问题,引入图神经网络(GNN)建模商品-用户-属性三元关系,结合Elasticsearch关键词召回与行为序列Transformer编码,设计动态权重融合策略;通过离线对比实验验证,召回集AUC从0.78提升至0.84,线上CTR增长5.2%,长尾商品曝光占比从12%提升至18%。
- 主导排序层多任务模型升级,基于原Wide&Deep架构迭代为DeepFM+MMOE混合模型,显式建模点击、转化、客单价三目标冲突与协同;同步接入实时特征平台(TDBank)提取用户搜索词嵌入、上下文行为序列等动态特征,通过特征重要性分析筛选Top20关键特征,离线NDCG@10提升12.7%,大促期间搜索GMV占比从35%提升至41%。
- 设计重排层因果推断优化方案,针对位置偏差导致的优质商品下沉问题,采用逆概率加权(IPW)校正曝光样本分布,结合业务规则(库存健康度、商家服务分)构建多约束排序框架;上线后头部位置无效曝光减少23%,高毛利商品转化率提升8.9%,商家侧优质商品曝光满意度调研得分从4.1分(满分5分)提升至4.6分。
- 推动搜索系统性能优化,针对高并发场景下召回延迟高的痛点,引入FAISS向量索引加速商品语义向量检索,结合动态剪枝策略过滤低相关候选;优化后召回响应时间从80ms降至35ms,支撑大促期间峰值QPS从5万提升至12万,系统超时率下降90%。