当前模板已根据「自然语言处理工程师」岗位深度优化
选择其他岗位
开始编辑模板后,您可以进一步自定义包括:工作履历、工作内容、信息模块、颜色配置等
内置经深度优化的履历,将为你撰写个人简历带来更多灵感。
陆明哲的照片
陆明哲
用系统化的思维解决问题,用温度化的方式交付成果,这是我的工作准则。
28岁
3年工作经验
13800138000
DB@zjengine.com
求职意向
自然语言处理工程师
长沙
薪资面谈
一周内到岗
工作经历
2022.07 - 至今
小楷内容科技有限公司
资深自然语言处理算法工程师

负责公司内容电商平台的多模态内容理解与智能生产全链路算法设计,边界涵盖文本生成、语义检索、内容审核三大核心模块的模型迭代及业务赋能,目标是提升内容生产效率与用户体验。

  • 主导构建电商垂类多意图文本生成模型,基于LLaMA-2-7B进行领域适配微调,融合商品知识库(含10万+SKU属性、50万+场景描述)的TransE图谱嵌入,解决生成内容偏离商品核心卖点的痛点——引入InfoNCE对比学习框架,将商品属性一致性作为约束信号,同时加入实体掩码策略(随机mask商品属性词后要求模型补全),最终生成内容与商品属性的匹配准确率从65%提升至90%;该模型支撑平台“商品详情页自动生成”功能落地,对应商品转化率较人工撰写版本提升18%,日均节省运营撰写时间40小时。
  • 核心参与内容社区语义检索系统升级,针对长尾查询召回低的问题,基于BERT-base做领域适配,引入多任务学习融合语义相似度与用户兴趣embedding(通过协同过滤生成用户兴趣向量),并将商品类目、价格区间等结构化特征编码为辅助信号;优化后长尾查询召回率从62%提升至81%,用户日均使用检索功能时长增加25分钟,社区内容互动率提升12%。
  • 重点优化内容审核模型的小样本学习能力,针对违规类型分布偏移(如新增“诱导私下交易”类别),采用Prompt Tuning适配新类别,结合主动学习框架(基于不确定性采样选择难例标注),将模型迭代周期从7天缩短至3天;同时通过知识蒸馏将大模型推理速度提升4倍,误判率下降22%,支撑平台日均1000万+条内容的实时审核。
  • 推动大模型在内容生产辅助中的落地,设计基于LLM的文案润色工具,集成情感分析(基于RoBERTa-wwm-finance微调)与风格迁移模块(通过ControlNet约束输出语气),支持运营人员快速修改商品推广语;工具 adoption 率达75%,运营撰写一条优质推广语的时间从15分钟缩至5分钟,效率提升40%。
2020.03 - 2022.06
小楷信息流科技有限公司
自然语言处理算法工程师

负责信息流平台的内容标签体系与个性化推荐中的文本语义理解模块开发,边界包括标签自动标注、用户兴趣建模、跨模态语义对齐,目标是提升内容分发的精准度与用户粘性。

  • 主导设计基于BiLSTM-CRF的财经新闻实体识别模型,针对“营收”“净利润”等术语的歧义问题(如“苹果营收”vs“水果苹果营收”),在输入层加入领域词典的注意力增强机制——通过预训练财经词典词向量加权,强化模型对专业术语的感知;最终实体识别F1-score从89%提升至94%,支撑平台新闻内容的自动分类(覆盖12个财经子类),分类准确率提升11%,用户点击转化率增加15%。
  • 核心参与用户兴趣画像的文本维度优化,将用户浏览文本的Word2Vec词向量与协同过滤生成的用户兴趣embedding融合,构建“文本-兴趣”联合表征;优化后用户兴趣匹配的点击转化率提升15%,日均阅读时长增加18分钟,信息流的次日留存率提升8%。
  • 重点解决跨模态内容(图文)的语义对齐问题,基于轻量级CLIP模型适配,将图文相似度计算的准确率从71%提升至85%;该优化支撑内容分发系统更精准地匹配图文内容与用户兴趣,人均PV提升22%,广告点击率增加9%。
  • 推动标签系统的自动化迭代,开发基于主动学习的标签纠错流程——通过模型预测置信度筛选难例,标注成本降低40%;标签覆盖率从82%提升至91%,内容推荐的召回率提升19%,用户对“感兴趣内容”的满意度调研得分从4.2分升至4.6分(满分5分)。
2018.07 - 2020.02
小楷内容分发科技有限公司
初级自然语言处理算法工程师

协助完成内容平台的文本分类与关键词提取功能开发,边界包括垂直领域语料预处理、基础模型训练、效果评估,目标是夯实平台内容理解的基础能力。

  • 协助搭建财经新闻文本分类模型,针对jieba分词对“市盈率(P/E)”“市净率(PB)”等专业术语的分词错误问题,手动构建5000+条财经领域分词词典并集成到jieba中;结合TF-IDF特征与SVM分类器,分类准确率从78%提升至85%,支撑平台财经频道的内容自动归类,覆盖率达90%,减少人工标注工作量30%。
  • 开发关键词提取工具,基于TextRank算法优化——引入领域停用词表(含“据悉”“笔者认为”等无意义词)和词性过滤(保留名词、动名词),关键词召回率从70%提升至82%;帮助运营人员快速定位内容核心信息,运营整理一篇财经资讯的时间从30分钟缩至15分钟。
  • 参与用户评论的情感分析项目,用朴素贝叶斯模型处理极性分类(正面/负面),针对短文本歧义问题(如“还行吧”),加入表情符号特征(正向表情加权、负向表情降权);情感判断准确率从78%提升至85%,支撑用户反馈的分析,平台根据负面评论优化产品功能的响应速度提升20%。
  • 负责语料库的清洗与标注,制定财经领域文本的标注规范(如“行业动态”“公司公告”等类别定义),标注准确率达95%;构建的5万条标注语料成为后续模型训练的基础,节省后续标注成本约50%。
技能特长
沟通能力
执行能力
热情坦诚
文案能力
项目经验
2023.06 - 2024.03
星途互动科技有限公司
算法工程负责人

长视频用户留存与个性化推荐算法闭环优化项目

  • 项目背景:公司核心长视频App连续两季度30日留存率下滑至28%,用户日均观看时长同比下降15%,核心问题在于传统协同过滤推荐模型对冷启动用户覆盖不足、多源数据(用户行为/内容元数据/社交关系)融合效率低,且缺乏模型效果的快速验证与迭代机制。我的总体职责是主导“用户分层-特征迭代-模型优化-效果回流”的全链路算法闭环体系建设,目标是提升留存与观看时长。
  • 关键难题与技术:一是冷启动用户兴趣捕捉难——传统模型依赖历史行为,新用户特征稀疏;二是多模态数据融合效率低——用户行为序列、内容文本/图像、社交关系数据分散在不同系统,难以形成统一用户画像;三是效果评估滞后——离线指标与在线业务结果脱节,模型迭代风险高。技术上,我选择用GraphSAGE构建用户-内容-社交的异构图谱,将用户基础属性、首次互动行为与社交链嵌入同一向量空间;用Apache Iceberg搭建湖仓一体数据平台,解决数据孤岛问题;引入因果推断的倾向得分匹配(PSM)方法,分离推荐模型的真实增量效果。
  • 核心行动与创新:针对冷启动,设计“基础属性+社交链+首次行为”的混合嵌入层,让新用户无需历史行为即可生成初始兴趣向量;为整合多源数据,主导开发了实时特征工程 pipeline,用Spark Structured Streaming处理用户行为流,将内容元数据与社交关系同步映射到用户画像;建立“离线AUC/LogLoss+在线AB测试+长期留存归因”的三层评估体系,通过PSM计算推荐带来的增量观看时长,将模型迭代的风险成本降低40%。
  • 成果与价值:项目上线后,App30日留存率提升至32%(+14.2%),用户日均观看时长增加21分钟(+18.5%);推荐系统迭代周期从7天缩短至3天,冷启动用户点击转化率提升27%;闭环体系被纳入公司算法标准流程,我个人主导的GraphSAGE图谱方案成为后续用户分层的基础框架。
2021.10 - 2023.05
星途互动科技有限公司
高级算法工程师

短视频内容标签体系与精准分发算法升级项目

  • 项目背景:公司短视频业务用户量突破5000万,但内容标签依赖人工标注,覆盖率仅60%,标签一致性问题突出(不同标注员对同一内容的分类差异达35%),导致分发精准度低——中小创作者内容曝光量仅占整体的18%,整体完播率低于行业均值5个百分点。我的职责是构建自动化多维度内容标签体系,优化分发算法以平衡用户体验与创作者生态。
  • 关键难题与技术:一是人工标注成本高、一致性差——每月需投入20人/月标注,且标签准确率波动大;二是短视频内容模态复杂——仅靠文本标题无法覆盖视觉(封面/画面)、音频(台词/背景音乐)的特征;三是分发公平性不足——头部内容占据70%流量,中小创作者缺乏成长空间。技术上,我采用多模态深度学习模型:用BERT提取内容标题与描述的语义特征,ResNet识别封面图与关键帧的视觉特征,YAMNet分析音频的情绪与话题标签,融合三模态特征生成内容标签;用主动学习策略减少人工标注量,将模型预测不确定的样本推给人工校准。
  • 核心行动与创新:设计“多模态融合+主动学习”标签流程——模型先自动生成标签,将置信度低于0.8的样本推给人工标注,将人工标注量从每月20人/月降至5人/月,标签覆盖率提升至95%;分发算法中引入公平性约束,用拉格朗日乘数法平衡“用户观看时长”与“中小创作者曝光占比”两个目标,确保中小创作者内容获得至少25%的流量倾斜。
  • 成果与价值:内容标签准确率从72%提升至89%,中小创作者曝光量增加40%,短视频整体完播率提升13%至行业均值以上;创作者满意度调研得分从3.8分(满分5)升至4.3分,新创作者留存率提升19%;标签体系支持了后续的“内容垂类推荐”“创作者成长计划”等业务,成为公司短视频生态的基础能力。
奖项荣誉
  • 计算机技术与软件专业技术资格(水平)证书(中级,软件设计师)
  • 2023年全国人工智能应用技术技能大赛NLP赛道三等奖
  • 2023年度公司优秀技术员工
自我评价
  • 长期聚焦互联网场景,擅长将NLP能力与业务目标强绑定,拒绝“为指标而优化”的无效迭代。
  • 秉持算法落地工程化思维,模型压缩、服务部署均前置规划,确保成果快速转化为线上能力。
  • 解决问题先拆解“用户需求-数据特征-模型适配”三层逻辑,避免盲目堆模型的资源浪费。
  • 主动同步算法对业务的价值影响,推动产品运营协同调整策略,让NLP成为业务增长支撑。
试一下,换个颜色
选择配色
使用此模板创建简历
  • 支持电脑端、微信小程序编辑简历
  • 支持一键更换模板,自由调整字距行距
  • 支持微信分享简历给好友查看
  • 支持简历封面、自荐信、自定义简历模块
  • 支持导出为PDF、图片、在线打印、云端保存
该简历模板已内置
  • 个人名称
  • 头像
  • 基本信息
  • 求职意向
  • 工作经历
  • 项目经验
  • 实习经验
  • 作品展示
  • 奖项荣誉
  • 校园经历
  • 教育背景
  • 兴趣爱好
  • 技能特长
  • 语言能力
  • 自我评价
  • 报考信息
  • 简历封面
  • 自荐信
对话框
提示
说明