职位描述
- C/C++
- 深度学习
- 算法工程化经验
- 并行计算
- 模型加速/性能优化
- Python
1、负责深度学习框架的基础功能开发,实现各种计算操作,支持常见芯片平台;
2、使用各种高性能计算库提升深度学习框架计算速度;
3、紧跟业内最新技术,甄别技术成熟度。
工作要求
1、高性能计算、并行计算、异构计算、性能优化;
2、扎实的计算机系统,组成原理和体系结构基础;
3、丰富的CPU、GPU、TPU、NPU、x86、ARM、DSP或者AI处理器调优经验;
4、CUDA, cuDNN, TensorRT, OpenBLAS, OpenMP, MKL, OpenCL或其他并行计算/HPC开发经验;
5、XLA,TVM,MLIR, Halide, Tiramisu和Glow计算图优化经验;
6、编译器(LLVM/GCC),AI框架经验;
7、具有量化/压缩/稀疏/混精运算等领域的实际经验是一个加分项;
认证资质
马先生
竞争力分析
BOSS 安全提示
BOSS直聘严禁用人单位和招聘者用户做出任何损害求职者合法权益的违法违规行为,包括但不限于扣押求职者证件、收取求职者财物、向求职者集资、让求职者入股、诱导求职者异地入职、异地参加培训、违法违规使用求职者简历等,您一旦发现此类行为, 请立即举报
精选职位
页面更新时间:2025-01-20