当前模板已根据「自然语言处理工程师」岗位深度优化
选择其他岗位
开始编辑模板后,您可以进一步自定义包括:工作履历、工作内容、信息模块、颜色配置等
内置经深度优化的履历,将为你撰写个人简历带来更多灵感。
陆明哲
用系统化的思维解决问题,用温度化的方式交付成果,这是我的工作准则。
28岁
3年工作经验
13800138000
DB@zjengine.com
陆明哲的照片
求职意向
自然语言处理工程师
长沙
薪资面谈
三个月内到岗
工作经历
2022.07 - 2024.06
小楷智能科技有限公司
高级自然语言处理工程师

负责公司智能客服系统与内容生成平台的多模态NLP模型全生命周期管理,覆盖意图识别、情感分析、商品描述生成等核心场景,支撑日均1200万次用户交互及百万级商品内容的自动化生产,聚焦模型效果、生产效率与业务落地的全链路优化。

  • 主导智能客服意图识别模型的端到端迭代,针对电商场景中“退换货原因模糊”“促销规则歧义”等长尾意图召回率低(原68%)的问题,采用BERT+BiLSTM+CRF融合架构,嵌入用户行为序列(浏览/加购/下单日志)作为时序辅助特征,结合主动学习策略每月标注1.2万条高价值样本,将意图召回率提升至89%、误判率下降15%,直接支撑客服团队单均处理时长从11分钟缩短至7.7分钟,效率提升30%。
  • 核心参与内容生成平台的商品描述自动化模块开发,针对传统模板生成内容同质化严重、转化率低的痛点,基于GPT-2微调并结合商品知识图谱(含10万+SKU属性、5万+场景标签),设计“知识注入+风格迁移”双分支模型——通过实体链接将SKU属性嵌入生成过程,再用风格分类器约束文本调性(如“性价比”“高端感”),最终将商品描述点击转化率从2.1%提升至3.8%,单月减少人工撰写成本8万元,覆盖美妆、家居等5个核心品类。
  • 重点突破情感分析模型的小样本适应瓶颈,面对新品类(宠物用品)用户评论数据少(仅500条标注样本)的问题,采用T5模型+Prompt Engineering技术,构建“情感倾向+原因抽取”少样本适配器,仅需100条样本即可达到全量训练85%的准确率,快速支持宠物用品频道的情感监控,将负面评论响应时间从4小时压缩至1小时内,帮助运营团队及时处理客诉。
  • 负责NLP模型的生产部署与性能优化,将BERT-base模型通过TensorRT量化压缩(FP32转INT8),推理延迟从120ms降至35ms;同时在GPU资源不变的情况下,通过并发优化支撑QPS从500提升至1200;搭建基于Prometheus+Grafana的模型监控系统,实时预警模型漂移(如意图分布变化超过5%触发重训),保障线上模型稳定性达99.95%以上,全年未出现因模型问题导致的客服故障。
2020.03 - 2022.06
小楷在线教育科技有限公司
初级自然语言处理工程师

参与在线教育平台的NLP功能落地,聚焦题目解析、学情分析核心场景,负责从数据处理、模型调优到生产上线的全流程工作,支撑百万级学生用户的学习数据挖掘与个性化教学辅助。

  • 主导题库系统知识点标签自动生成模块,针对人工标注成本高(每道题需3分钟)的问题,基于BiLSTM+Attention模型结合题目文本、答案解析、关联考点数据,设计多任务学习框架(同时预测知识点与难度等级),将知识点标签准确率从72%提升至88%,累计自动生成120万道题的标签,节省人工标注成本约2400小时,覆盖初中数学、英语等3个主科。
  • 核心参与学情分析系统的学生答题文本分析功能,针对初中数学解答题“步骤缺失”“逻辑错误”识别不准确的问题,采用BERT微调并结合规则引擎(匹配“没考虑定义域”“公式记错”等关键词),构建细粒度错误类型分类模型,将错误识别准确率从65%提升至82%,帮助老师快速定位学生薄弱点,试点班级数学平均分提升11分,被纳入公司核心教学辅助工具。
  • 负责低年级语文“看拼音写词语”题型模型的优化,针对拼音与汉字映射错误的问题,引入字符级CRF模型结合拼音声母韵母特征,将写词准确率从85%提升至94%,支撑题库的自适应练习推荐,学生练习完成率从62%提升至80%,提升了用户留存率。
  • 参与模型部署与A/B测试体系搭建,将模型打包成Docker容器部署在Kubernetes集群,实现自动扩缩容(应对开学季访问量提升3倍的峰值);同时设计A/B测试方案,对比新旧模型的知识点标签准确率、错误识别召回率等指标,确保每次迭代都有明确业务提升(如准确率至少提升5%),保障功能落地的有效性。
2018.07 - 2020.02
小楷教育科技有限公司
自然语言处理实习生

协助教育类NLP项目的基础工作,覆盖数据清洗、模型训练与效果验证,参与题目分类、语义相似度计算等任务,积累从数据到模型的全流程实践经验。

  • 协助完成教育题库语义相似度计算功能,针对题目表述不同但考点一致的问题(如“一元二次方程解法”与“解一元二次方程的方法”),采用Word2Vec预训练词向量结合余弦相似度,预处理10万条题目文本(清洗停用词、标准化术语),将相似度计算准确率从60%提升至75%,支撑题库去重与个性化推荐。
  • 参与初中数学题目分类的数据标注与预处理,制定“代数/几何/统计”的二级分类规范,标注2万条题目数据,同时清洗重复、格式错误的题目,提升训练数据质量,为后续模型调优奠定基础。
  • 负责LR模型的基础调优,对比TF-IDF与词袋模型的特征效果,调整正则化系数(从0.1调至0.01)与学习率(从0.001调至0.0001),将题目分类准确率从70%提升至78%,协助项目组完成初期功能验证。
  • 参与语义相似度模型的效果评估,设计人工评测指标(如“考点一致性”“表述差异度”),标注1000条测试样本,验证模型在实际场景中的有效性,输出《语义相似度模型评测报告》,为模型迭代提供方向。
项目经验
2022.09 - 2024.03
星途互娱科技有限公司
算法工程负责人

泛娱乐用户内容偏好精准匹配及商业化提效算法项目

  • 星途互娱作为长视频+互动内容融合平台,面临用户内容消费转化低(CTR仅8.2%)、商业化ROI不足(广告eCPM约120元)的痛点——原有推荐模型未充分捕捉互动内容(如分支剧情、用户UGC互动、弹幕行为)的时序特性与关系网络,且无法平衡点击、会员转化、广告收益的多目标。我的核心职责是主导从特征工程到模型部署的全流程算法迭代,目标是将用户个性化匹配准确率与商业化效率同步提升。
  • 项目攻克两大技术难点:一是互动内容的多模态时序特征融合——传统模型仅处理文本/图像,忽略用户“弹幕发送→分支剧情选择→点赞UGC”的行为序列;二是多目标优化失衡——单目标优化会导致“重点击轻转化”或“重广告轻体验”的矛盾。技术方案上,我引入Transformer变体(TimeSformer)编码互动行为的时序依赖,结合GNN建模“用户-内容-创作者”的三元关系网络;多目标层采用帕累托最优加权策略,融合CTR、CVR(会员转化)、eCPM三个目标的损失函数,并加入业务规则约束(如会员内容优先级高于普通广告)。
  • 我的关键行动包括:1)牵头搭建互动内容多模态特征平台,整合用户行为日志、互动内容元数据,用Timm框架微调CLIP模型处理互动中的表情包/截图特征;2)设计动态权重调整机制,通过离线A/B测试(覆盖10万+用户样本)与在线灰度发布,将多目标损失权重从固定值改为基于用户画像的实时调整;3)优化模型部署,用TensorRT加速推理引擎,将单请求 latency 从50ms压缩至18ms,支撑高峰期10万QPS的推荐请求。
  • 项目成果显著:CTR较迭代前提升28%至10.5%,会员转化率提升19%至4.1%,广告eCPM增长15%至138元,月均商业化收入增加超800万元;模型已推广至公司短视频、直播等其他产品线,带动整体用户时长提升12%。我个人主导了全链路技术方案设计与落地,解决了互动内容推荐的“特征稀疏”与“目标冲突”核心问题,成为团队算法商业化的标杆案例。
2020.06 - 2022.08
云联工业互联网有限公司
高级算法工程师

工业物联网设备故障预测算法研发及规模化部署项目

  • 云联科技的工业IoT平台服务制造型企业,但客户反馈设备故障预测准确率仅65%、误报率达20%,导致停机损失年均超百万元——原有模型基于简单时序统计,未处理传感器噪声、样本不平衡(故障数据占比<1%)及跨设备泛化问题。我的角色是高级算法工程师,负责模型研发与规模化落地,目标是将故障预测准确率提升至85%以上,误报率降至5%以下。
  • 项目难点集中在三点:一是设备数据噪声大(如温度传感器漂移、振动信号缺失),传统清洗方法易丢失关键故障特征;二是样本极度不平衡,常规分类模型偏向“正常”类别;三是不同设备型号(如机床、机器人)的工况差异大,模型泛化性差。技术突破上,我用LSTM+Attention融合滑动窗口特征,抑制噪声的同时保留故障前的异常波动;采用SMOTE过采样+ focal loss 解决样本不平衡,聚焦故障样本的学习;基于预训练的设备embedding模型(用Word2Vec处理设备元数据),针对不同型号做微调,提升跨设备泛化。
  • 我的核心行动:1)采集10家工厂500+台设备的时序数据(涵盖振动、温度、电流等10+维度),设计“滑动窗口+插值填充”的清洗 pipeline,保留95%以上的有效特征;2)构建融合设备元数据(型号、出厂日期)与实时时序特征的模型架构,在3家客户工厂试点,根据反馈调整特征——比如加入“设备运行时长×环境温度”的交互特征,降低误报;3)用Flask开发RESTful API,对接客户MES系统,实现“分钟级”故障预警,并提供可解释性报告(如“振动信号异常→轴承磨损概率80%”)。
  • 项目成果:故障预测准确率提升至89%,误报率降至4.2%,帮助客户平均停机时间减少35%、维护成本降低28%;云联科技凭借此项目拿到3个大客户续约(年合同额超500万)及2个新客户(汽车制造、电子装配行业)。我个人解决了工业数据“脏、少、异”的核心问题,推动算法从实验室走向规模化工业场景,成为公司工业AI产品的核心竞争力。
技能特长
沟通能力
执行能力
热情坦诚
文案能力
自我评价
  • 深耕NLP语义理解、生成及多模态技术链路,习惯从业务价值倒推方案,曾通过意图识别优化让C端问题解决率显著提升,聚焦技术落地最后一公里。
  • 不追技术噱头,先扎进业务场景摸痛点——电商场景优先优化评论情感分析细粒度标签,让推荐更贴合需求,技术始终对准业务目标。
  • 遇小样本、低资源问题,主动整合迁移学习与弱监督搭轻量框架,把问题变成技术迭代的契机。
  • 和产品运营协作时,用对方能听懂的语言讲清技术边界,既避免过度预期,也主动同步进展推动共识。
试一下,换个颜色
选择配色
使用此模板创建简历
  • 支持电脑端、微信小程序编辑简历
  • 支持一键更换模板,自由调整字距行距
  • 支持微信分享简历给好友查看
  • 支持简历封面、自荐信、自定义简历模块
  • 支持导出为PDF、图片、在线打印、云端保存
该简历模板已内置
  • 个人名称
  • 头像
  • 基本信息
  • 求职意向
  • 工作经历
  • 项目经验
  • 实习经验
  • 作品展示
  • 奖项荣誉
  • 校园经历
  • 教育背景
  • 兴趣爱好
  • 技能特长
  • 语言能力
  • 自我评价
  • 报考信息
  • 简历封面
  • 自荐信
对话框
提示
说明