各大行业职位任你选
首次验证通过即注册BOSS直聘账号职位描述
- 强化学习
1.负责大模型强化学习方向技术研发,包括数据探索与增强、奖励模型优化、强化策略迭代及效果评估等,持续提升算法的效率与效果;
2.强化学习技术前瞻探索,包括但不限于离线强化学习、环境模型学习、约束强化学习等方向;
3.基于强化学习技术,利用人类反馈信号提升语言模型能力
岗位基本需求
1.五年以上相关工作经验,具备强化学习的业务实践并取得较好的业务价值;
2.扎实的算法基础,熟悉强化学习、自然语言处理和机器学习技术,对技术开发及应用有热情;
3.具备强化学习算法优化经验,熟悉DQN、TRPO、PPO、SAC、BCQ、MCQ、SUNRISE等强化学习算法,能够基于实际业务问题优化算法;
4.熟悉Python、Java等至少一种编程语言,具有良好的编程能力和扎实的数学理论基础;
5.关注行业前沿进展,对技术开发及应用有热情,有自己的想法并乐于挑战自我;
6.良好的沟通能力和跨团队协作能力,能够梳理繁杂的工作并建立有效机制,推动上下游配合完成目标;
具备以下者优先
1、有大语言模型算法优化和大规模分布式强化学习框架优化经验优先
2、有强化学习相关方向的团队或项目管理经验者优先
认证资质
王先生
竞争力分析
BOSS 安全提示
BOSS直聘严禁用人单位和招聘者用户做出任何损害求职者合法权益的违法违规行为,包括但不限于扣押求职者证件、收取求职者财物、向求职者集资、让求职者入股、诱导求职者异地入职、异地参加培训、违法违规使用求职者简历等,您一旦发现此类行为, 请立即举报
了解更多职场安全防范知识精选职位
更新于:2024-11-04