招聘中

混元大模型强化学习算法研究员-北京深圳

50-80K·16薪

北京 5-10年 硕士

...
五险一金补充医疗保险定期体检年终奖股票期权带薪年假员工旅游免费班车餐补交通补助包吃节日福利住房补贴零食下午茶公仔周边活动免费健身房免费早晚餐
五险一金补充医疗保险定期体检年终奖股票期权带薪年假员工旅游免费班车餐补交通补助包吃节日福利住房补贴零食下午茶公仔周边活动免费健身房免费早晚餐
混元大模型强化学习算法研究员-北京深圳 50-80K·16薪
...
五险一金补充医疗保险定期体检年终奖股票期权带薪年假员工旅游免费班车餐补交通补助包吃节日福利住房补贴零食下午茶公仔周边活动免费健身房免费早晚餐
五险一金补充医疗保险定期体检年终奖股票期权带薪年假员工旅游免费班车餐补交通补助包吃节日福利住房补贴零食下午茶公仔周边活动免费健身房免费早晚餐
腾讯 查看所有职位

各大行业职位任你选

首次验证通过即注册BOSS直聘账号
+86
已阅读并同意BOSS直聘《用户协议》 《隐私政策》,允许BOSS直聘统一管理本人账号信息

公司基本信息

不需要融资

10000人以上

互联网

查看全部职位
计算

职位描述

  • RLHF
  • 大模型对齐
  • 强化学习
工作内容
1. 负责大语言模型/多模态大模型的强化学习算法研究与开发工作,包括奖励模型、强化学习算法的开发实现及效果调优等;
2. 负责探索和追踪业界强化学习的前沿算法及技术,并在大模型场景应用,提升大模型对齐能力。
任职要求:
1. 计算机、数学、机器学习等相关专业,具备良好的数学基础;
2. 熟悉深度学习常用的理论和方法,熟练使用PyTorch等主流深度学习框架;
3. 熟悉强化学习和大模型对齐相关技术,具备大模型奖励模型、强化学习开发和调优经验者优先;
4. 具备较强的问题归纳分析及解决问题的能力,以及良好的数据洞察能力和研究能力。
5. 具备强烈的进取心、求知欲及团队合作精神,热衷于追求技术创新。

詹女士 2月内活跃

腾讯·招聘经理

竞争力分析

加载中...
个人综合排名:人中排名第
一般 良好 优秀 极好

BOSS 安全提示

BOSS直聘严禁用人单位和招聘者用户做出任何损害求职者合法权益的违法违规行为,包括但不限于扣押求职者证件、收取求职者财物、向求职者集资、让求职者入股、诱导求职者异地入职、异地参加培训、违法违规使用求职者简历等,您一旦发现此类行为, 请立即举报

了解更多职场安全防范知识

公司介绍

腾讯以技术丰富互联网用户的生活。
通过通信及社交平台微信和 QQ 促进用户联系,并助其连接数字内容和生活服务,尽在弹指间。
通过高效广告平台,协助品牌和市场营销者触达数以亿计的中国消费者。
通过金融科技及企业服务,促进合作伙伴业务发展,助力实现数字化升级。
我们大力投资于人才队伍和推动科技创新,积极参与互联网行业协同发展。
腾讯于 1998 年11月在中国深圳成立,2004 年6月在香港联合交易所主板上市。
查看全部

工商信息

  • 公司名称腾讯科技(上海)有限公司
  • 法定代表人奚丹
  • 成立日期2008-07-23
  • 企业类型有限责任公司(港澳台法人独资)
  • 经营状态存续
  • 注册资金500万美元
查看全部

工作地址

北京海淀区腾讯北京总部大楼1栋
公司地址

点击查看地图

精选职位

更新于:2024-10-17

快速完善简历,与Boss开聊

与在线Boss直接聊,最快当天拿offer

快速完善信息