简历模板预览_当前模板已根据「自然语言处理工程师」岗位深度优化_深色表头在职求职简历模板_免费简单风格简历模板_上下通栏布局简历模板在线编辑

求职意向: 自然语言处理工程师; 长沙; 薪资面谈; 随时到岗

工作经历

2022.07 - 至今

小楷内容科技有限公司

资深自然语言处理算法工程师

负责公司内容电商平台的多模态内容理解与智能生产全链路算法设计，边界涵盖文本生成、语义检索、内容审核三大核心模块的模型迭代及业务赋能，目标是提升内容生产效率与用户体验。

主导构建电商垂类多意图文本生成模型，基于LLaMA-2-7B进行领域适配微调，融合商品知识库（含10万+SKU属性、50万+场景描述）的TransE图谱嵌入，解决生成内容偏离商品核心卖点的痛点——引入InfoNCE对比学习框架，将商品属性一致性作为约束信号，同时加入实体掩码策略（随机mask商品属性词后要求模型补全），最终生成内容与商品属性的匹配准确率从65%提升至90%；该模型支撑平台“商品详情页自动生成”功能落地，对应商品转化率较人工撰写版本提升18%，日均节省运营撰写时间40小时。
核心参与内容社区语义检索系统升级，针对长尾查询召回低的问题，基于BERT-base做领域适配，引入多任务学习融合语义相似度与用户兴趣embedding（通过协同过滤生成用户兴趣向量），并将商品类目、价格区间等结构化特征编码为辅助信号；优化后长尾查询召回率从62%提升至81%，用户日均使用检索功能时长增加25分钟，社区内容互动率提升12%。
重点优化内容审核模型的小样本学习能力，针对违规类型分布偏移（如新增“诱导私下交易”类别），采用Prompt Tuning适配新类别，结合主动学习框架（基于不确定性采样选择难例标注），将模型迭代周期从7天缩短至3天；同时通过知识蒸馏将大模型推理速度提升4倍，误判率下降22%，支撑平台日均1000万+条内容的实时审核。
推动大模型在内容生产辅助中的落地，设计基于LLM的文案润色工具，集成情感分析（基于RoBERTa-wwm-finance微调）与风格迁移模块（通过ControlNet约束输出语气），支持运营人员快速修改商品推广语；工具 adoption 率达75%，运营撰写一条优质推广语的时间从15分钟缩至5分钟，效率提升40%。

2020.03 - 2022.06

小楷信息流科技有限公司

自然语言处理算法工程师

负责信息流平台的内容标签体系与个性化推荐中的文本语义理解模块开发，边界包括标签自动标注、用户兴趣建模、跨模态语义对齐，目标是提升内容分发的精准度与用户粘性。

主导设计基于BiLSTM-CRF的财经新闻实体识别模型，针对“营收”“净利润”等术语的歧义问题（如“苹果营收”vs“水果苹果营收”），在输入层加入领域词典的注意力增强机制——通过预训练财经词典词向量加权，强化模型对专业术语的感知；最终实体识别F1-score从89%提升至94%，支撑平台新闻内容的自动分类（覆盖12个财经子类），分类准确率提升11%，用户点击转化率增加15%。
核心参与用户兴趣画像的文本维度优化，将用户浏览文本的Word2Vec词向量与协同过滤生成的用户兴趣embedding融合，构建“文本-兴趣”联合表征；优化后用户兴趣匹配的点击转化率提升15%，日均阅读时长增加18分钟，信息流的次日留存率提升8%。
重点解决跨模态内容（图文）的语义对齐问题，基于轻量级CLIP模型适配，将图文相似度计算的准确率从71%提升至85%；该优化支撑内容分发系统更精准地匹配图文内容与用户兴趣，人均PV提升22%，广告点击率增加9%。
推动标签系统的自动化迭代，开发基于主动学习的标签纠错流程——通过模型预测置信度筛选难例，标注成本降低40%；标签覆盖率从82%提升至91%，内容推荐的召回率提升19%，用户对“感兴趣内容”的满意度调研得分从4.2分升至4.6分（满分5分）。

2018.07 - 2020.02

小楷内容分发科技有限公司

初级自然语言处理算法工程师

协助完成内容平台的文本分类与关键词提取功能开发，边界包括垂直领域语料预处理、基础模型训练、效果评估，目标是夯实平台内容理解的基础能力。

协助搭建财经新闻文本分类模型，针对jieba分词对“市盈率（P/E）”“市净率（PB）”等专业术语的分词错误问题，手动构建5000+条财经领域分词词典并集成到jieba中；结合TF-IDF特征与SVM分类器，分类准确率从78%提升至85%，支撑平台财经频道的内容自动归类，覆盖率达90%，减少人工标注工作量30%。
开发关键词提取工具，基于TextRank算法优化——引入领域停用词表（含“据悉”“笔者认为”等无意义词）和词性过滤（保留名词、动名词），关键词召回率从70%提升至82%；帮助运营人员快速定位内容核心信息，运营整理一篇财经资讯的时间从30分钟缩至15分钟。
参与用户评论的情感分析项目，用朴素贝叶斯模型处理极性分类（正面/负面），针对短文本歧义问题（如“还行吧”），加入表情符号特征（正向表情加权、负向表情降权）；情感判断准确率从78%提升至85%，支撑用户反馈的分析，平台根据负面评论优化产品功能的响应速度提升20%。
负责语料库的清洗与标注，制定财经领域文本的标注规范（如“行业动态”“公司公告”等类别定义），标注准确率达95%；构建的5万条标注语料成为后续模型训练的基础，节省后续标注成本约50%。

项目经验

2022.03 - 2023.08

星途互动科技有限公司

算法工程负责人

星途直播用户兴趣演化推荐系统重构与性能优化

项目背景：原有基于协同过滤+静态特征的推荐系统无法应对直播场景用户兴趣的分钟级变化——新用户冷启动成功率仅35%、老用户30日留存率下滑至42%，且无法捕捉“主播临时换游戏”“观众因弹幕互动转移兴趣”等动态行为。核心目标是重构支持实时兴趣追踪、多模态融合的推荐引擎，直接提升用户粘性与商业转化效率；我的职责是主导算法方案设计、工程落地及跨数据/工程/产品团队的协同。
关键难题：1）实时兴趣捕捉的低延迟（要求<100ms）与高准确性平衡——传统离线特征更新无法满足秒级变化；2）直播内容（视频帧、弹幕、礼物）与用户行为（点击、停留、互动）的多模态异构数据语义对齐；3）千万级用户规模的实时特征存储与更新效率，避免特征管道成为性能瓶颈。
核心行动：1）算法侧：采用动态图神经网络（DGNN）建模用户兴趣演化路径，将用户行为序列转化为“节点-边”动态图（如“点击英雄联盟直播→停留10分钟→发弹幕‘666’”形成连续兴趣链），相比传统RNN模型更精准捕捉非线性兴趣变化；2）工程侧：用Apache Flink搭建流处理管道，将特征更新延迟从60秒压缩至<30ms，同时将DGNN推理层从TensorFlow迁移到TorchScript并量化模型，单用户推理延迟从150ms降至60ms；3）特征工程：设计“兴趣衰减加权模块”，对用户近7天的行为按时间窗口赋予权重（如1小时内的行为权重0.8，7天前的权重0.1），过滤过期噪声。
项目成果：推荐系统CTR从4.2%提升至5.4%（+28%），新用户冷启动成功率升至58%，30日留存率回升至54%；工程层面支持千万级用户实时推荐，特征更新延迟稳定在<50ms。作为项目负责人，我主导了从算法选型到生产落地的全流程，推动系统成为直播业务的核心增长引擎，获公司Q3季度“技术创新一等奖”。

2020.10 - 2022.02

星途互动科技有限公司

算法工程师

直播内容标签体系自动化构建与商业化落地

项目背景：原有内容标签依赖人工标注——单场直播需2小时标注，新内容标签上线需1天，导致推荐匹配准确率仅38%、广告投放ROI低下（eCPM仅12元）。核心目标是构建自动化、实时化的内容标签体系，覆盖“内容属性-用户兴趣-商业价值”三维标签，支撑推荐与广告的精准匹配；我的职责是负责算法开发、标签效果评估及商业化场景落地。
关键难题：1）多源数据噪声过滤——主播口语化表达（如“家人们点点关注”）、无关弹幕（如“主播真帅”）会干扰标签准确性；2）标签层级关系建模——“游戏直播”→“MOBA直播”→“英雄联盟直播”的层级语义需精准关联；3）商业标签与内容属性的关联——如何定义“高客单价商品适配”的标签并量化其商业价值。
核心行动：1）算法选型：用BERT-base预训练模型做文本分类（处理主播描述、弹幕），结合CRF层解决标签序列依赖（如“游戏直播”后必须跟“品类标签”），用GraphSAGE挖掘标签间层级关联（如“英雄联盟”属于“MOBA”）；2）噪声过滤：设计“规则+机器学习”混合模块——用正则表达式过滤重复话术，用逻辑回归模型识别低价值弹幕（如长度<3字、无语义关联）；3）商业标签建模：以广告点击率、礼物收入为因变量，训练XGBoost模型预测标签的商业价值，输出“高/中/低”三档评分。
项目成果：标签生产效率提升70%（单场直播生成时间从2小时降至40分钟），标签准确率从65%提升至89%；广告点击率从3.1%升至3.8%（+22%），内容与用户兴趣匹配准确率提升至68%。支撑了公司广告业务精准投放，年广告收入增加约1200万元。我负责核心算法模块开发与效果迭代，推动标签体系从人工标注转向自动化，成为公司内容生态的基础数据底座。

兴趣爱好: 摄影; 看书; 阅读; 跑步

奖项荣誉

计算机技术与软件专业技术资格（水平）证书（中级，软件设计师）
2023年度公司优秀技术员工
AI自然语言处理算法竞赛（公司级）一等奖

技能特长: 沟通能力; 执行能力; 热情坦诚; 文案能力

自我评价

长期聚焦互联网场景，擅长将NLP能力与业务目标强绑定，拒绝“为指标而优化”的无效迭代。
秉持算法落地工程化思维，模型压缩、服务部署均前置规划，确保成果快速转化为线上能力。
解决问题先拆解“用户需求-数据特征-模型适配”三层逻辑，避免盲目堆模型的资源浪费。
主动同步算法对业务的价值影响，推动产品运营协同调整策略，让NLP成为业务增长支撑。

教育背景: 2013.09 - 2016.06

XX市第一中学

理科重点班

通过系统化的数理课程训练（物理/数学竞赛班），培养了严密的逻辑思维能力和复杂问题拆解方法论；担任校科技社副社长期间，主导“简易机器人编程”项目，锻炼了技术方案落地的执行力，获省级创新大赛三等奖。; 2016.09 - 2020.06

XX理工大学

计算机科学与技术（本科）

主修数据结构、算法设计等核心课程（GPA 3.7/4.0），构建系统性技术知识框架；通过校企合作项目“智慧校园小程序开发”（担任后端组长），将理论转化为高并发场景下的解决方案，服务3所高校超2万用户。获校级“技术创新标兵”（Top 5%）。

实习经验

2019.08 - 2020.01

小楷网络

内容运营实习生

爆款内容方法论：负责3个抖音账号（总粉丝50w+）内容策划，通过“热点标签+情绪钩子”公式使爆款率提升25%，单条视频最高播放量破千万；
用户增长引擎：设计“测评类内容互动链路”，引导用户自发生产UGC 800+条，带动账号单月增粉12万（超KPI 150%）；
商业化创新：策划“国货测评盲盒”活动（0预算），撬动5个品牌方赞助商品，实现账号首单GMV转化15万元。

校园经历

2020.09 - 2022.06

XX师范大学文学院

传统文化短视频品牌主理

因痛心于年轻人对历史的疏离，我在B站创立「古人脱口秀」栏目，用职场梗解构历史事件（如《雍正皇帝的KPI保卫战》）。通过设计「颠覆认知-史料佐证-现代共鸣」三幕剧本模板，单期视频最高收获1.7万条弹幕互动。
两年间栏目播放量突破180万，作品被多地中学选为教学素材。这段经历磨砺出将学术内容转化为大众语言的能力，也让我理解到真实用户反馈才是创作者的指南针。

语言能力

英语（CET-6，熟练阅读英文技术文档及论文）

报考信息: 填写报考学校

填写报考专业

选择学校LOGO

科目1

分数1

科目2

分数2

科目3

分数3

科目4

分数4

作品展示: 点击添加作品 （以图片格式上传，支持jpg/png，单张体积最大2M，最多支持添加9张图片）; 扫码查看作品