各大行业职位任你选
首次验证通过即注册BOSS直聘账号职位描述
- C++
- 大模型
- GPU
1、负责开发和优化大模型推理框架;
2、主要通过GPU CUDA性能优化的手段,结合线上实际情况,打造高性能LLM推理引擎;
3、负责机器学习系统前瞻技术的调研和引入。
任职要求
1、精通C/C++,精通算法与数据结构,熟悉Python;
2、熟练GPU的高性能计算优化技术,深入理解计算机体系结构,熟悉并行计算优化、访存优化,低比特计算等;
3、具备丰富的基于CUDA的GPU性能优化经验;
4、了解深度学习算法基本原理,熟悉神经网络基本架构和各算子计算方式,了解至少一种深度学习训练框架及其模型文件的解析,如Pytorch、Tensorflow;
5、熟悉TensorRT-LLM、ORCA、VLLM等;
6、了解主流LLM 模型,有LLM模型加速优化经验者优先。
王女士 刚刚活跃
竞争力分析
BOSS 安全提示
BOSS直聘严禁用人单位和招聘者用户做出任何损害求职者合法权益的违法违规行为,包括但不限于扣押求职者证件、收取求职者财物、向求职者集资、让求职者入股、诱导求职者异地入职、异地参加培训、违法违规使用求职者简历等,您一旦发现此类行为, 请立即举报
公司介绍
我们致力于成为构建全场景、 面向全渠道、服务全人群的全球标志性科技品牌,
荣耀以创新、品质和服务作为三大战略控制点,坚持研发及前瞻性技术的持续投入,
为全球消费者带来不断创新的智能设备, 创造属于每个人的智慧新世界。
工商信息
- 公司名称荣耀终端有限公司
- 法定代表人吴晖
- 成立日期2020-04-01
- 企业类型有限责任公司(外商投资、非独资)
- 经营状态存续
- 注册资金3223894.756749万人民币
工作地址
点击查看地图
精选职位
更新于:2024-09-14