当前模板已根据「自然语言处理工程师」岗位深度优化
选择其他岗位
开始编辑模板后,您可以进一步自定义包括:工作履历、工作内容、信息模块、颜色配置等
内置经深度优化的履历,将为你撰写个人简历带来更多灵感。
陆明哲的照片
陆明哲
用系统化的思维解决问题,用温度化的方式交付成果,这是我的工作准则。
28岁
3年工作经验
13800138000
DB@zjengine.com
求职意向
自然语言处理工程师
长沙
薪资面谈
随时到岗
工作经历
2022.07 - 至今
小楷内容科技有限公司
资深自然语言处理算法工程师

负责公司内容电商平台的多模态内容理解与智能生产全链路算法设计,边界涵盖文本生成、语义检索、内容审核三大核心模块的模型迭代及业务赋能,目标是提升内容生产效率与用户体验。

  • 主导构建电商垂类多意图文本生成模型,基于LLaMA-2-7B进行领域适配微调,融合商品知识库(含10万+SKU属性、50万+场景描述)的TransE图谱嵌入,解决生成内容偏离商品核心卖点的痛点——引入InfoNCE对比学习框架,将商品属性一致性作为约束信号,同时加入实体掩码策略(随机mask商品属性词后要求模型补全),最终生成内容与商品属性的匹配准确率从65%提升至90%;该模型支撑平台“商品详情页自动生成”功能落地,对应商品转化率较人工撰写版本提升18%,日均节省运营撰写时间40小时。
  • 核心参与内容社区语义检索系统升级,针对长尾查询召回低的问题,基于BERT-base做领域适配,引入多任务学习融合语义相似度与用户兴趣embedding(通过协同过滤生成用户兴趣向量),并将商品类目、价格区间等结构化特征编码为辅助信号;优化后长尾查询召回率从62%提升至81%,用户日均使用检索功能时长增加25分钟,社区内容互动率提升12%。
  • 重点优化内容审核模型的小样本学习能力,针对违规类型分布偏移(如新增“诱导私下交易”类别),采用Prompt Tuning适配新类别,结合主动学习框架(基于不确定性采样选择难例标注),将模型迭代周期从7天缩短至3天;同时通过知识蒸馏将大模型推理速度提升4倍,误判率下降22%,支撑平台日均1000万+条内容的实时审核。
  • 推动大模型在内容生产辅助中的落地,设计基于LLM的文案润色工具,集成情感分析(基于RoBERTa-wwm-finance微调)与风格迁移模块(通过ControlNet约束输出语气),支持运营人员快速修改商品推广语;工具 adoption 率达75%,运营撰写一条优质推广语的时间从15分钟缩至5分钟,效率提升40%。
2020.03 - 2022.06
小楷信息流科技有限公司
自然语言处理算法工程师

负责信息流平台的内容标签体系与个性化推荐中的文本语义理解模块开发,边界包括标签自动标注、用户兴趣建模、跨模态语义对齐,目标是提升内容分发的精准度与用户粘性。

  • 主导设计基于BiLSTM-CRF的财经新闻实体识别模型,针对“营收”“净利润”等术语的歧义问题(如“苹果营收”vs“水果苹果营收”),在输入层加入领域词典的注意力增强机制——通过预训练财经词典词向量加权,强化模型对专业术语的感知;最终实体识别F1-score从89%提升至94%,支撑平台新闻内容的自动分类(覆盖12个财经子类),分类准确率提升11%,用户点击转化率增加15%。
  • 核心参与用户兴趣画像的文本维度优化,将用户浏览文本的Word2Vec词向量与协同过滤生成的用户兴趣embedding融合,构建“文本-兴趣”联合表征;优化后用户兴趣匹配的点击转化率提升15%,日均阅读时长增加18分钟,信息流的次日留存率提升8%。
  • 重点解决跨模态内容(图文)的语义对齐问题,基于轻量级CLIP模型适配,将图文相似度计算的准确率从71%提升至85%;该优化支撑内容分发系统更精准地匹配图文内容与用户兴趣,人均PV提升22%,广告点击率增加9%。
  • 推动标签系统的自动化迭代,开发基于主动学习的标签纠错流程——通过模型预测置信度筛选难例,标注成本降低40%;标签覆盖率从82%提升至91%,内容推荐的召回率提升19%,用户对“感兴趣内容”的满意度调研得分从4.2分升至4.6分(满分5分)。
2018.07 - 2020.02
小楷内容分发科技有限公司
初级自然语言处理算法工程师

协助完成内容平台的文本分类与关键词提取功能开发,边界包括垂直领域语料预处理、基础模型训练、效果评估,目标是夯实平台内容理解的基础能力。

  • 协助搭建财经新闻文本分类模型,针对jieba分词对“市盈率(P/E)”“市净率(PB)”等专业术语的分词错误问题,手动构建5000+条财经领域分词词典并集成到jieba中;结合TF-IDF特征与SVM分类器,分类准确率从78%提升至85%,支撑平台财经频道的内容自动归类,覆盖率达90%,减少人工标注工作量30%。
  • 开发关键词提取工具,基于TextRank算法优化——引入领域停用词表(含“据悉”“笔者认为”等无意义词)和词性过滤(保留名词、动名词),关键词召回率从70%提升至82%;帮助运营人员快速定位内容核心信息,运营整理一篇财经资讯的时间从30分钟缩至15分钟。
  • 参与用户评论的情感分析项目,用朴素贝叶斯模型处理极性分类(正面/负面),针对短文本歧义问题(如“还行吧”),加入表情符号特征(正向表情加权、负向表情降权);情感判断准确率从78%提升至85%,支撑用户反馈的分析,平台根据负面评论优化产品功能的响应速度提升20%。
  • 负责语料库的清洗与标注,制定财经领域文本的标注规范(如“行业动态”“公司公告”等类别定义),标注准确率达95%;构建的5万条标注语料成为后续模型训练的基础,节省后续标注成本约50%。
项目经验
2022.03 - 2023.08
星途互动科技有限公司
算法工程负责人

星途直播用户兴趣演化推荐系统重构与性能优化

  • 项目背景:原有基于协同过滤+静态特征的推荐系统无法应对直播场景用户兴趣的分钟级变化——新用户冷启动成功率仅35%、老用户30日留存率下滑至42%,且无法捕捉“主播临时换游戏”“观众因弹幕互动转移兴趣”等动态行为。核心目标是重构支持实时兴趣追踪、多模态融合的推荐引擎,直接提升用户粘性与商业转化效率;我的职责是主导算法方案设计、工程落地及跨数据/工程/产品团队的协同。
  • 关键难题:1)实时兴趣捕捉的低延迟(要求<100ms)与高准确性平衡——传统离线特征更新无法满足秒级变化;2)直播内容(视频帧、弹幕、礼物)与用户行为(点击、停留、互动)的多模态异构数据语义对齐;3)千万级用户规模的实时特征存储与更新效率,避免特征管道成为性能瓶颈。
  • 核心行动:1)算法侧:采用动态图神经网络(DGNN)建模用户兴趣演化路径,将用户行为序列转化为“节点-边”动态图(如“点击英雄联盟直播→停留10分钟→发弹幕‘666’”形成连续兴趣链),相比传统RNN模型更精准捕捉非线性兴趣变化;2)工程侧:用Apache Flink搭建流处理管道,将特征更新延迟从60秒压缩至<30ms,同时将DGNN推理层从TensorFlow迁移到TorchScript并量化模型,单用户推理延迟从150ms降至60ms;3)特征工程:设计“兴趣衰减加权模块”,对用户近7天的行为按时间窗口赋予权重(如1小时内的行为权重0.8,7天前的权重0.1),过滤过期噪声。
  • 项目成果:推荐系统CTR从4.2%提升至5.4%(+28%),新用户冷启动成功率升至58%,30日留存率回升至54%;工程层面支持千万级用户实时推荐,特征更新延迟稳定在<50ms。作为项目负责人,我主导了从算法选型到生产落地的全流程,推动系统成为直播业务的核心增长引擎,获公司Q3季度“技术创新一等奖”。
2020.10 - 2022.02
星途互动科技有限公司
算法工程师

直播内容标签体系自动化构建与商业化落地

  • 项目背景:原有内容标签依赖人工标注——单场直播需2小时标注,新内容标签上线需1天,导致推荐匹配准确率仅38%、广告投放ROI低下(eCPM仅12元)。核心目标是构建自动化、实时化的内容标签体系,覆盖“内容属性-用户兴趣-商业价值”三维标签,支撑推荐与广告的精准匹配;我的职责是负责算法开发、标签效果评估及商业化场景落地。
  • 关键难题:1)多源数据噪声过滤——主播口语化表达(如“家人们点点关注”)、无关弹幕(如“主播真帅”)会干扰标签准确性;2)标签层级关系建模——“游戏直播”→“MOBA直播”→“英雄联盟直播”的层级语义需精准关联;3)商业标签与内容属性的关联——如何定义“高客单价商品适配”的标签并量化其商业价值。
  • 核心行动:1)算法选型:用BERT-base预训练模型做文本分类(处理主播描述、弹幕),结合CRF层解决标签序列依赖(如“游戏直播”后必须跟“品类标签”),用GraphSAGE挖掘标签间层级关联(如“英雄联盟”属于“MOBA”);2)噪声过滤:设计“规则+机器学习”混合模块——用正则表达式过滤重复话术,用逻辑回归模型识别低价值弹幕(如长度<3字、无语义关联);3)商业标签建模:以广告点击率、礼物收入为因变量,训练XGBoost模型预测标签的商业价值,输出“高/中/低”三档评分。
  • 项目成果:标签生产效率提升70%(单场直播生成时间从2小时降至40分钟),标签准确率从65%提升至89%;广告点击率从3.1%升至3.8%(+22%),内容与用户兴趣匹配准确率提升至68%。支撑了公司广告业务精准投放,年广告收入增加约1200万元。我负责核心算法模块开发与效果迭代,推动标签体系从人工标注转向自动化,成为公司内容生态的基础数据底座。
奖项荣誉
  • 计算机技术与软件专业技术资格(水平)证书(中级,软件设计师)
  • 2023年度公司优秀技术员工
  • AI自然语言处理算法竞赛(公司级)一等奖
技能特长
沟通能力
执行能力
热情坦诚
文案能力
自我评价
  • 长期聚焦互联网场景,擅长将NLP能力与业务目标强绑定,拒绝“为指标而优化”的无效迭代。
  • 秉持算法落地工程化思维,模型压缩、服务部署均前置规划,确保成果快速转化为线上能力。
  • 解决问题先拆解“用户需求-数据特征-模型适配”三层逻辑,避免盲目堆模型的资源浪费。
  • 主动同步算法对业务的价值影响,推动产品运营协同调整策略,让NLP成为业务增长支撑。
试一下,换个颜色
选择配色
使用此模板创建简历
  • 支持电脑端、微信小程序编辑简历
  • 支持一键更换模板,自由调整字距行距
  • 支持微信分享简历给好友查看
  • 支持简历封面、自荐信、自定义简历模块
  • 支持导出为PDF、图片、在线打印、云端保存
该简历模板已内置
  • 个人名称
  • 头像
  • 基本信息
  • 求职意向
  • 工作经历
  • 项目经验
  • 实习经验
  • 作品展示
  • 奖项荣誉
  • 校园经历
  • 教育背景
  • 兴趣爱好
  • 技能特长
  • 语言能力
  • 自我评价
  • 报考信息
  • 简历封面
  • 自荐信
对话框
提示
说明