职位&公司对比

招聘中

自然语言处理

-K
  • 大数据
职位关闭

NLP预训练算法工程师

-K·薪
北京/苏州/硅谷某中型医疗健康公司

职位详情

  • 北京
  • 3-5年
  • 硕士
  • 自然语言处理
  • 机器学习
  • 数据挖掘

岗位职责: 1.负大数据业务算法方案设计,推动方案在业务系统的实现。 2.采用数据挖掘、机器学习、自然语言处理,协同过滤等技术,分析海量数据,设计基于数据的学习模型和策略; 3.独立完成数据分析任务,从海量的数据中挖掘出有价值的信息;     BOSS直聘 岗位要求: 1. 计算机、数学相关专业本科以上学历 2.  扎实的数据结构及算法功底,优秀的工程实现能力 3.  熟悉分类、聚类、回归、图计算等机器学习算法 4.  熟悉Linux开发环境,熟悉C/C++/python/R等任一一种语言,能快速建立模型并对模型进行验证 5.  来自BOSS直聘海量数据处理和并行计算开发经验者优先,如Hadoop、Storm、Spark 6.  熟悉广告或推荐系统架构,以及算法设计、测试、上线的流程; 7. 优秀的分析问题解决问题能力、BOSS直聘学习能力、团队合作意识 8. 对数据敏感,对技术有热情,对业界最新的技术动态感兴趣并能应用于具体问题的解决

职位详情

  • 北京
  • 5-10年
  • 本科
  • 大模型算法
  • 文本生成
  • C/C++
  • Python
  • 预训练

职位性质:全职 工作职责: 1.参与蛋白质或NLP大语言模预训练的相关研发和优化,包括预训练大模型方案实现、改进、调优; 2.针对下游生物领域的任务,包括符蛋白质、复合物折叠,蛋白稳定性等任务进行fine-tuning,跑出SOTA水平; 3.维护千亿语言模型持续训练和微调,应对超大规模语言模型出现的计算不稳定性问题,保障计算效率以及计算资源利用率; 4.对预训练大模型训练/评测数据进行分析、整理、优化; 职位要求: 1.熟悉生成式和理解式的各类语言模型架构,深入理解Transformer等变体以及算子,并能够对其改进,同时优化模型健康度; 2.熟悉NLP 、CV、生物计算中的下游boss和评测任务,对任务和模型能力有一定的理解,能够运用大模型优化任务; 3.有在卡集群上训练过百亿级以上的稠密Transformer模型者优先; 4.熟悉以下一项或多项技术框架或模型优先BOSS直聘: GLM, Megatron, DeepSpeedkanzhun, ESM2, PEFT, OpenFold; 5.在自然语言处理或机器学习顶会(ACL,EMNLP,NAACL,ICML,NeurIPS, ICLR) 或有丰富的刷榜经验者优先;  6.同时具备大模型任务调优经验和大模型HPC经验者优先;

技能解析

专有技能
  • 合作意识
  • 方案设计
  • 海量数据
  • 机器学习算法
  • 数据分析
  • 优秀的分析
  • 分析问题
  • 开发经验
  • 学习算法
  • 算法设计
  • 数据处理
  • 数据挖掘
  • 解决问题能力
  • 基于数据
  • 海量数据处理
  • 解决问题
  • 系统架构
  • 团队合作
  • 数据结构
  • 问题解决
  • 数据敏感
  • 团队合作意识
  • 学习能力
  • 开发环境
相同技能
  • 机器学习
  • 自然语言

数据来自CSL职业科学研究室

技能解析

专有技能
  • 数据进行分析
  • 模型训练
  • 技术框架
相同技能
  • 机器学习
  • 自然语言

数据来自CSL职业科学研究室

公司福利

  • 五险一金
  • 补充医疗保险
  • 定期体检
  • 加班补助
  • 年终奖
  • 带薪年假
  • 员工旅游
  • 交通补助
  • 节日福利
  • 零食下午茶
  • 生日福利
  • 通讯补贴
  • 免费班车
  • 团建聚餐
  • 餐补
  • 绩效奖金

备注

职位发布者未明确表明公司信息,具体可咨询职位发布人进行确认。

更新于 2025-03-23