各大行业职位任你选
首次验证通过即注册BOSS直聘账号职位描述
- RLHF
- 大模型对齐
- 强化学习
1. 负责大语言模型/多模态大模型的强化学习算法研究与开发工作,包括奖励模型、强化学习算法的开发实现及效果调优等;
2. 负责探索和追踪业界强化学习的前沿算法及技术,并在大模型场景应用,提升大模型对齐能力。
任职要求:
1. 计算机、数学、机器学习等相关专业,具备良好的数学基础;
2. 熟悉深度学习常用的理论和方法,熟练使用PyTorch等主流深度学习框架;
3. 熟悉强化学习和大模型对齐相关技术,具备大模型奖励模型、强化学习开发和调优经验者优先;
4. 具备较强的问题归纳分析及解决问题的能力,以及良好的数据洞察能力和研究能力。
5. 具备强烈的进取心、求知欲及团队合作精神,热衷于追求技术创新。
詹女士 2月内活跃
竞争力分析
BOSS 安全提示
BOSS直聘严禁用人单位和招聘者用户做出任何损害求职者合法权益的违法违规行为,包括但不限于扣押求职者证件、收取求职者财物、向求职者集资、让求职者入股、诱导求职者异地入职、异地参加培训、违法违规使用求职者简历等,您一旦发现此类行为, 请立即举报
了解更多职场安全防范知识公司介绍
通过通信及社交平台微信和 QQ 促进用户联系,并助其连接数字内容和生活服务,尽在弹指间。
通过高效广告平台,协助品牌和市场营销者触达数以亿计的中国消费者。
通过金融科技及企业服务,促进合作伙伴业务发展,助力实现数字化升级。
我们大力投资于人才队伍和推动科技创新,积极参与互联网行业协同发展。
腾讯于 1998 年11月在中国深圳成立,2004 年6月在香港联合交易所主板上市。
工商信息
- 公司名称腾讯科技(上海)有限公司
- 法定代表人奚丹
- 成立日期2008-07-23
- 企业类型有限责任公司(港澳台法人独资)
- 经营状态存续
- 注册资金500万美元
工作地址
点击查看地图
精选职位
更新于:2024-10-17