职位描述
- C++
- 团队管理经验
- GPU集群部署
- CUDA和NCCL
- OpenGL
- AIGC大模型训练和推理
"岗位职责:
1. 负责AIGC大模型训练和推理部署及算子加速优化
2. 负责AIGC大模型异构GPU芯片的软硬件技术平台的设计和算子加速优化
3. 负责AI大模型训推优化的前沿技术研究和产品落地
任职要求:
1、硕士研究生8年以上工作经验,本科10年以上工作经验
2、3年及以上NVIDIA GPU开发和性能优化经验,熟悉pytorch,tensorflow开发框架,并熟练掌握GPU性能分析工具(Nsight System/Compute)以及算子性能理论分析模型;
3、熟悉英伟达AI 套件全栈软件(熟悉各种加速库,含CUDA,NCCL,Tools,及各种调优,部署工具)
4、满足以下至少2条设计和开发经验要求:
---CUDA和NCCL的优化工作
---GPU集群部署的性能优化工作,了解GPU互联,IB网络
---AI大模型相关的训推融合算子优化
---AI编译器图层和算子层优化的设计
5、有大模型训推经验和架构性能优化经验优先;
加分项
熟练掌握C/C++编程技能,有扎实的编程基础、良好的编程风格和工作习惯
在GPU、NPU上开发过高性能计算加速库经验者优先
熟悉OpenAI Triton或cutlass 者优先"
认证资质

杨先生
竞争力分析


BOSS 安全提示
BOSS直聘严禁用人单位和招聘者用户做出任何损害求职者合法权益的违法违规行为,包括但不限于扣押求职者证件、收取求职者财物、向求职者集资、让求职者入股、诱导求职者异地入职、异地参加培训、违法违规使用求职者简历等,您一旦发现此类行为, 请立即举报
了解更多职场安全防范知识精选职位
页面更新时间:2025-02-27