职位&公司对比

职位关闭

NLP预训练算法工程师

-K·薪
北京/苏州/硅谷某中型医疗健康公司

职位详情

  • 北京
  • 不限
  • 硕士
  • 自然语言处理
  • Java
  • Python

工作职责 1.开发和优化数据挖掘,自然语言处理,推荐系统等领域的特定算法。 2.利用state-of-the-art的算法解决大规模文本的语义理解,信息抽取,统计,分类,检索,和推荐等产品问题。 3.研究自然语言处理领域最新进展,并应用到业务中。 任职条件 1.有自然语言处理,自然语言理解,机器学习等领域的实际项目研发经验;深入理解中文kanzhun分词,词性标注,句法分析,及统计模型、机器学习、数据挖掘的概念和常用方法;直聘有搜索引擎,文本推直聘荐系统,广告推荐系统,自动文摘,人机对话等boss领域产品开发经验者优先。 2.对大规模文本数据挖掘系统有深入理解,有Hadoop, Storm, Spark, HBase, Cassandra, MongoDB相关工作经验优先考虑。 3.精通大规模索引和查询系统(如Lucene或Solr者)。 4.精通Java或Python,熟悉Linux开发环境,有较强的编程能力。 5.有独立研究、实验的能力,优秀的分析问题解决问题的能力,对解决具有挑战性问题充满激情。 6.敬业踏实、积极主动、思维清晰,良好的责任心,较强抗压能力。 7.学历要求:硕士及以上。

职位详情

  • 北京
  • 5-10年
  • 本科
  • 大模型算法
  • 文本生成
  • C/C++
  • Python
  • 预训练

职位性质:全职 工作职责: 1.参与蛋白质或NLP大语言模型预训练的相关研发和优化,包括预训练大模型方案实现、改进、调优; 2.针对下游生物领域的任务,包括符蛋白质、复合物折叠,蛋白稳定性等任务进行fine-tuning,跑出SOTA水平; 3.维护千亿语言模型持续训练和微调,应对超大规模语言模型出现的计算不稳定性问题,保障计算效率以及计算资源利用率; 4.对预训练大模型训练/评测数据进行分析、整理、优化; 职位要求: 1.熟悉生成式和理解式的各类语言模型架构,深入理解Transformer等变体以及算子,并能够对其改进,同时优化模型健康度; 2.熟悉NLP 、CV、生物计算中的下游和评测任务,对直聘任务和模型能力有一定的理解,能够运用大模型优化任务; 3.有在千卡集群上训练过百亿级以上的稠密Transformer模型者优先; 4.熟悉以下一项或多项技术框架或模型优先: GLM, Megatron, 直聘DeepSpeed, ESM2, PEFT, OpenFold; 5.在自然语言处理或机器学习顶会BOSS直聘(ACL,EMNLP,NAACBOSS直聘L,ICML,NeuBOSS直聘rIPS, ICLR) 或有丰富的刷榜经验者优先;  6.同时具备大模型任务调优经验和大模型HPC经验者优先;

技能解析

专有技能
  • 开发和优化
  • 产品开发
  • 产品开发经验
  • 解决问题的能力
  • 解决问题
  • 编程能力
  • 优秀的分析
  • 分析问题
  • 分析问题和解决问题的能力
  • 开发经验
  • 研发经验
  • 搜索引擎
  • 开发环境
  • 数据挖掘
相同技能
  • 机器学习
  • 自然语言

数据来自CSL职业科学研究室

技能解析

专有技能
  • 数据进行分析
  • 模型训练
  • 技术框架
相同技能
  • 机器学习
  • 自然语言

数据来自CSL职业科学研究室

公司福利

  • 五险一金
  • 补充医疗保险
  • 定期体检
  • 加班补助
  • 年终奖
  • 带薪年假
  • 员工旅游
  • 交通补助
  • 节日福利
  • 零食下午茶
  • 生日福利
  • 通讯补贴
  • 免费班车
  • 团建聚餐
  • 餐补
  • 绩效奖金

备注

职位发布者未明确表明公司信息,具体可咨询职位发布人进行确认。

更新于 2025-01-25