招聘中 猎头职位

大模型推理加速专家

50-80K·16薪

代招公司:某大型知名互联网公司深圳 5-10年 硕士

...
交通补助节日福利免费班车有无线网团建聚餐员工旅游带薪年假年终奖定期体检意外险补充医疗保险五险一金公仔周边活动免费健身房
交通补助节日福利免费班车有无线网团建聚餐员工旅游带薪年假年终奖定期体检意外险补充医疗保险五险一金公仔周边活动免费健身房
大模型推理加速专家 50-80K·16薪
...
交通补助节日福利免费班车有无线网团建聚餐员工旅游带薪年假年终奖定期体检意外险补充医疗保险五险一金公仔周边活动免费健身房
交通补助节日福利免费班车有无线网团建聚餐员工旅游带薪年假年终奖定期体检意外险补充医疗保险五险一金公仔周边活动免费健身房

各大行业职位任你选

首次验证通过即注册BOSS直聘账号
+86
已阅读并同意BOSS直聘《用户协议》 《隐私政策》,允许BOSS直聘统一管理本人账号信息
计算

职位描述

  • 发表算法相关优秀论文
  • 分布式训练
  • 推理加速
  • 算法工程化经验
  • 参加算法相关竞赛/获奖
  • Python
岗位职责
1.配合算法工程师,推动深度学习相关算法的落地,打造高吞吐、低延时的推理系统;
2.优化大模型推理性能,提升吞吐并控制成本;
3.优化大模型推理框架,提升框架易用性和可调试性。
岗位要求
1.熟练掌握 C/C++、Python语言,有计算机体系结构背景或软件开发背景,熟悉系统性能调优的方式;
2.具备基础的GPU编程能力,包括但不限于Cuda、OpenCL;熟悉至少一种GPU加速库,如cublas、cudnn、cutlass等;
3.有Tensorrt/FasterTransformer/Tensorrt-llm/vllm等深度学习推理框架的实际使用经验;
4.熟悉各类深度学习网络和算子底层实现细节,训练和推理模型调试、调优有实操经验优先;
5.熟悉CPU/GPU异构加速瓶颈分析方法,有服务器端 AI 芯片、GPU加速经验优先;
6.熟悉分布式推理常用加速方法,有超大模型分布式部署经验优先。

认证资质

  • 人力资源服务许可证

程女士

BOSS直聘猎头·猎头顾问

竞争力分析

加载中...
个人综合排名:人中排名第
一般 良好 优秀 极好

BOSS 安全提示

BOSS直聘严禁用人单位和招聘者用户做出任何损害求职者合法权益的违法违规行为,包括但不限于扣押求职者证件、收取求职者财物、向求职者集资、让求职者入股、诱导求职者异地入职、异地参加培训、违法违规使用求职者简历等,您一旦发现此类行为, 请立即举报

了解更多职场安全防范知识

精选职位

更新于:2024-11-15

快速完善简历,与Boss开聊

与在线Boss直接聊,最快当天拿offer

快速完善信息