负责视频Feed流推荐端到端算法设计与优化,覆盖用户多模态兴趣建模、候选集精准召回、排序策略实时迭代及全链路效果评估,联动产品、工程团队落地算法方案,核心目标提升用户观看时长、互动率及平台商业化效率。
- 主导设计**多模态用户兴趣建模框架**,针对传统协同过滤忽略内容语义的痛点,融合用户行为序列(点击/滑动/完播)、视频元数据(标题/标签/封面图的CLIP嵌入)及社交关系(好友观看、点赞的异构图结构),用PyTorch实现BERT+Transformer的多模态融合模型,离线AUC较原有模型提升8.2%,线上CTR周均提升3.1%,用户日均观看时长增加11分钟;
- 优化**候选集召回策略**,解决长尾视频曝光不足问题——基于GraphSAGE构建用户-视频-标签的异质关系图,提取节点 embedding 后用Faiss构建向量索引,结合双塔模型的“用户兴趣向量+视频内容向量”相似度计算,将召回覆盖率从65%提升至78%,同时Top10推荐准确率维持在89%以上,长尾视频(播放量<1万的视频)曝光量增长45%;
- 推动**排序模型实时化迭代**,针对用户短期兴趣变化捕捉滞后的问题,基于Flink搭建实时特征工程 pipeline,整合用户最近15分钟的点击、滑动、分享行为特征,替换原有的天级特征;用XGBoost+DeepFM组合模型替代单一DeepFM,排序响应时间从120ms降至45ms,线上GMV(视频打赏+广告点击)周均提升5.6%;
- 搭建**推荐系统多维度评估体系**,设计覆盖“用户体验(留存/观看时长/互动率)、业务价值(GMV/广告收入)、技术公平性(性别/年龄偏差、类目多样性)”的AB测试框架,引入SHAP值解释模型决策,推动每周完成10+组实验,实验迭代效率提升40%,帮助团队快速定位“社交关系特征过拟合”“长尾视频排序权重过低”等瓶颈问题。