职位已关闭

混元大语言模型奖励模型算法研究员

30-60K

深圳 3-5年 硕士

...
五险一金补充医疗保险定期体检年终奖股票期权带薪年假员工旅游免费班车餐补交通补助包吃节日福利住房补贴零食下午茶公仔周边活动免费健身房免费早晚餐
五险一金补充医疗保险定期体检年终奖股票期权带薪年假员工旅游免费班车餐补交通补助包吃节日福利住房补贴零食下午茶公仔周边活动免费健身房免费早晚餐
职位已关闭
混元大语言模型奖励模型算法研究员 30-60K
...
五险一金补充医疗保险定期体检年终奖股票期权带薪年假员工旅游免费班车餐补交通补助包吃节日福利住房补贴零食下午茶公仔周边活动免费健身房免费早晚餐
五险一金补充医疗保险定期体检年终奖股票期权带薪年假员工旅游免费班车餐补交通补助包吃节日福利住房补贴零食下午茶公仔周边活动免费健身房免费早晚餐
腾讯 查看所有职位

职位描述

  • 业务导向/研究导向
  • Python
  • Java
  • C/C++
  • 计算机相关专业
  • 机器学习算法/工程化经验
  • 深度学习经验
工作内容
1. 负责通用大语言模型强化学习中奖励模型的构建和开发,包括偏好数据构建、奖励模型训练及算法调优等。
2. 负责探索和跟踪大模型领域基于模型的效果评判及自反馈学习相关的研究和探索,提升大模型对齐效果。
任职要求
1. 计算机、数学、机器学习等相关专业,硕士及以上学历,具备良好的数学基础。
2. 熟悉深度学习常用的理论和方法,熟练使用PyTorch等主流深度学习框架,熟悉BERT、GPT等常见大语言模型架构及训练策略。
3. 有大语言模型奖励模型数据构建或大模型自动化评估等方面经验者优先。
4. 具备较强的问题归纳分析及解决问题的能力,以及良好的数据洞察能力和研究能力。
5. 具备强烈的进取心、求知欲及团队合作精神,热衷于追求技术创新。

陈先生 2周内活跃

腾讯·HRBP

竞争力分析

加载中...
个人综合排名:人中排名第
一般 良好 优秀 极好

BOSS 安全提示

BOSS直聘严禁用人单位和招聘者用户做出任何损害求职者合法权益的违法违规行为,包括但不限于扣押求职者证件、收取求职者财物、向求职者集资、让求职者入股、诱导求职者异地入职、异地参加培训、违法违规使用求职者简历等,您一旦发现此类行为, 请立即举报

了解更多职场安全防范知识

公司介绍

腾讯以技术丰富互联网用户的生活。
通过通信及社交平台微信和 QQ 促进用户联系,并助其连接数字内容和生活服务,尽在弹指间。
通过高效广告平台,协助品牌和市场营销者触达数以亿计的中国消费者。
通过金融科技及企业服务,促进合作伙伴业务发展,助力实现数字化升级。
我们大力投资于人才队伍和推动科技创新,积极参与互联网行业协同发展。
腾讯于 1998 年11月在中国深圳成立,2004 年6月在香港联合交易所主板上市。
查看全部

工商信息

  • 公司名称腾讯科技(上海)有限公司
  • 法定代表人奚丹
  • 成立日期2008-07-23
  • 企业类型有限责任公司(港澳台法人独资)
  • 经营状态存续
  • 注册资金500万美元
查看全部

工作地址

深圳南山区腾讯滨海大厦南山区海天二路33号
公司地址

点击查看地图

精选职位

更新于:2024-07-23

快速完善简历,与Boss开聊

与在线Boss直接聊,最快当天拿offer

快速完善信息