职位&公司对比
职位详情
- 北京
- 不限
- 硕士
- 自然语言处理
- Java
- Python
工作职责 1.开发和优化数据挖掘,自然语言处理,推荐系统等领域的特定算法。 2.利用state-of-the-art的算法解决大规模文本的语义理解,信息抽取,统计,分类,检索,和推荐等产品问题。 3.研究自然语言处理领域最新进展,并应用到业务中。 任职条件 1.有自然语言处理,自然语言理解,机器学习等领域的实际项目研发经验;深入理解中文kanzhun分词,词性标注,句法分析,及统计模型、机器学习、数据挖掘的概念和常用方法;直聘有搜索引擎,文本推直聘荐系统,广告推荐系统,自动文摘,人机对话等boss领域产品开发经验者优先。 2.对大规模文本数据挖掘系统有深入理解,有Hadoop, Storm, Spark, HBase, Cassandra, MongoDB相关工作经验优先考虑。 3.精通大规模索引和查询系统(如Lucene或Solr者)。 4.精通Java或Python,熟悉Linux开发环境,有较强的编程能力。 5.有独立研究、实验的能力,优秀的分析问题和解决问题的能力,对解决具有挑战性问题充满激情。 6.敬业踏实、积极主动、思维清晰,良好的责任心,较强抗压能力。 7.学历要求:硕士及以上。
职位详情
- 北京
- 5-10年
- 本科
- 大模型算法
- 文本生成
- C/C++
- Python
- 预训练
职位性质:全职 工作职责: 1.参与蛋白质或NLP大语言模型预训练的相关研发和优化,包括预训练大模型方案实现、改进、调优; 2.针对下游生物领域的任务,包括符蛋白质、复合物折叠,蛋白稳定性等任务进行fine-tuning,跑出SOTA水平; 3.维护千亿语言模型持续训练和微调,应对超大规模语言模型出现的计算不稳定性问题,保障计算效率以及计算资源利用率; 4.对预训练大模型训练/评测数据进行分析、整理、优化; 职位要求: 1.熟悉生成式和理解式的各类语言模型架构,深入理解Transformer等变体以及算子,并能够对其改进,同时优化模型健康度; 2.熟悉NLP 、CV、生物计算中的下游和评测任务,对直聘任务和模型能力有一定的理解,能够运用大模型优化任务; 3.有在千卡集群上训练过百亿级以上的稠密Transformer模型者优先; 4.熟悉以下一项或多项技术框架或模型优先: GLM, Megatron, 直聘DeepSpeed, ESM2, PEFT, OpenFold; 5.在自然语言处理或机器学习顶会BOSS直聘(ACL,EMNLP,NAACBOSS直聘L,ICML,NeuBOSS直聘rIPS, ICLR) 或有丰富的刷榜经验者优先; 6.同时具备大模型任务调优经验和大模型HPC经验者优先;
技能解析
- 开发和优化
- 产品开发
- 产品开发经验
- 解决问题的能力
- 解决问题
- 编程能力
- 优秀的分析
- 分析问题
- 分析问题和解决问题的能力
- 开发经验
- 研发经验
- 搜索引擎
- 开发环境
- 数据挖掘
- 机器学习
- 自然语言
数据来自CSL职业科学研究室
技能解析
- 数据进行分析
- 模型训练
- 技术框架
- 机器学习
- 自然语言
数据来自CSL职业科学研究室
公司福利
- 五险一金
- 补充医疗保险
- 定期体检
- 加班补助
- 年终奖
- 带薪年假
- 员工旅游
- 交通补助
- 节日福利
- 零食下午茶
- 生日福利
- 通讯补贴
- 免费班车
- 团建聚餐
- 餐补
- 绩效奖金
备注
职位发布者未明确表明公司信息,具体可咨询职位发布人进行确认。