负责电商平台商品内容理解与用户意图匹配的全链路算法优化,覆盖从文本特征工程到模型落地的全流程,支撑搜索推荐、智能客服、商家运营三大核心场景的精准化需求。
- 主导商品标题与详情页语义解析系统升级,以BERT-base-chinese为基础模型,融合电商领域词典(含12万+商品类目词、属性词)做领域适配微调;针对长文本关键信息丢失问题,设计分层注意力机制(将文本划分为“核心卖点”“规格参数”“服务保障”三个层级),将商品分类F1值从89%提升至94%,直接减少人工审核工作量30%,支撑大促期间百万级商品的快速上架。
- 核心参与用户搜索意图识别模块迭代,针对“送妈妈的生日礼物”“便宜耐用的家用投影仪”等模糊查询,构建“意图分类+实体链接”级联模型——意图分类用BiLSTM-CRF捕捉上下文依赖,实体链接结合用户历史行为序列(如浏览过的母婴类目、收藏的投影仪品牌)做个性化增强;上线后将模糊查询的意图召回率从75%提升至88%,对应场景搜索转化率增长2.1个百分点。
- 重点优化客服智能回复生成质量,基于GPT-2-medium微调,引入电商领域知识库(涵盖10万+商品常见问题、3万+售后解决方案),用FAISS构建索引实现实时知识检索;针对回复“答非所问”问题,加入意图一致性损失函数(约束生成内容与用户意图的余弦相似度≥0.8),将回复BLEU分数从0.68提升至0.85,客服响应时长缩短40%,用户对智能回复的满意度从62%升至77%。
- 推动模型轻量化落地,采用知识蒸馏技术将BERT-base压缩为DistilBERT(参数量减少40%),结合TensorRT优化推理引擎,部署至移动端APP的“拍题搜商品”功能;最终推理速度提升3倍,支持千万级日活用户的实时请求,服务可用性稳定在99.95%以上。