「职位对比」镖狮网数据挖掘算法架构师（自然语言处理方向）怎么样

工作职责 1.开发和优化数据挖掘，自然语言处理，推荐系统等领域的特定算法。 2.利用state-of-the-art的算法解决大规模文本的语义理解，信息抽取，统计，分类，检索，和推荐等产品问题。 3.研究自然语言处理领域最新进展，并应用到业务中。任职条件 1.有自然语言处理，自然语言理解，机器学习等领域的实际项目研发经验；深入理解中文kanzhun分词，词性标注，句法分析，及统计模型、机器学习、数据挖掘的概念和常用方法；直聘有搜索引擎，文本推直聘荐系统，广告推荐系统，自动文摘，人机对话等boss领域产品开发经验者优先。 2.对大规模文本数据挖掘系统有深入理解，有Hadoop, Storm, Spark, HBase, Cassandra, MongoDB相关工作经验优先考虑。 3.精通大规模索引和查询系统（如Lucene或Solr者）。 4.精通Java或Python，熟悉Linux开发环境,有较强的编程能力。 5.有独立研究、实验的能力，优秀的分析问题和解决问题的能力，对解决具有挑战性问题充满激情。 6.敬业踏实、积极主动、思维清晰，良好的责任心，较强抗压能力。 7.学历要求：硕士及以上。

职位详情

北京
5-10年
本科

大模型算法
文本生成
C/C++
Python
预训练

职位性质：全职工作职责： 1.参与蛋白质或NLP大语言模型预训练的相关研发和优化，包括预训练大模型方案实现、改进、调优； 2.针对下游生物领域的任务，包括符蛋白质、复合物折叠，蛋白稳定性等任务进行fine-tuning，跑出SOTA水平； 3.维护千亿语言模型持续训练和微调，应对超大规模语言模型出现的计算不稳定性问题，保障计算效率以及计算资源利用率； 4.对预训练大模型训练/评测数据进行分析、整理、优化；职位要求： 1.熟悉生成式和理解式的各类语言模型架构，深入理解Transformer等变体以及算子，并能够对其改进，同时优化模型健康度； 2.熟悉NLP 、CV、生物计算中的下游和评测任务，对直聘任务和模型能力有一定的理解，能够运用大模型优化任务； 3.有在千卡集群上训练过百亿级以上的稠密Transformer模型者优先； 4.熟悉以下一项或多项技术框架或模型优先: GLM, Megatron, 直聘DeepSpeed, ESM2, PEFT, OpenFold; 5.在自然语言处理或机器学习顶会BOSS直聘（ACL，EMNLP，NAACBOSS直聘L，ICML，NeuBOSS直聘rIPS, ICLR) 或有丰富的刷榜经验者优先； 6.同时具备大模型任务调优经验和大模型HPC经验者优先；

技能解析

专有技能

开发和优化
产品开发
产品开发经验
解决问题的能力
解决问题
编程能力
优秀的分析
分析问题
分析问题和解决问题的能力
开发经验
研发经验
搜索引擎
开发环境
数据挖掘

相同技能

机器学习
自然语言

数据来自CSL职业科学研究室

技能解析

专有技能

数据进行分析
模型训练
技术框架

相同技能

机器学习
自然语言

数据来自CSL职业科学研究室

公司福利

五险一金
补充医疗保险
定期体检
加班补助
年终奖
带薪年假
员工旅游
交通补助
节日福利
零食下午茶
生日福利
通讯补贴
免费班车
团建聚餐
餐补
绩效奖金

备注

职位发布者未明确表明公司信息，具体可咨询职位发布人进行确认。

职位&公司对比

数据挖掘算法架构师（自然语言处理方向）

NLP预训练算法工程师

数据挖掘算法架构师（自然语言处理方向）

NLP预训练算法工程师

职位详情

职位详情

技能解析

技能解析

公司福利