职位&公司对比

招聘中
  • 计算机软件
  • 未融资
招聘中

AI推理性能优化工程师

-K·薪
  • 计算机软件

职位详情

  • 上海
  • 3-5年
  • 本科
  • 数据库
  • 通信
  • C/C++
  • QT
  • MFC
  • VC++
  • GCC

职位要求: 1boss. 精通C/C++语言 2. 精通QT开发,熟练使用 QT Creator 开发工具,熟练使用常见 QT 库,熟悉QSS 、QML,能够实现基于QT的自定义控件,直聘掌握windows,Linux应用程序开发 3. 熟练握linux系统,熟悉串口开发,SOCKET编程,多线程并行与控制,懂得SOCKET通讯选择模式,异选择模式,事件选择模式等 4. 熟练掌握QGraphicsView等,能根据需求灵活应用,编写优质应用界面; 5. 熟悉多线程程序开发和调试,熟悉两种以上通讯开发,如RS232,TCP,UDP,USB; 岗位职责: 1、根据项目需求进行代码编写、单元测试、代码维护以及项目支持工作 2、负责项目期间的需求调研,代码修改,系统调试,客户培训等工作 3、编写代码说明手册,需求文档,设计文档等各类文档 4、其他领导交代的相关工作

职位详情

  • 上海
  • 3-5年
  • 本科
  • Python
  • 分布式经验
  • cuda
  • 算子开发

1、负责LLM和Diffusion Mobossdel的性能优化; 2、通过TensorRT、量化、剪枝、算子融合、CUDA算子编写等性能优化的手段,结合业务需求,将GPU性能发挥到极致; 3、负责百川推理优化技术的调研和引入; 4、与算法部门深度合作,进行算法与系统的联合优化。 职位要求 1、本科及以上学历,计算机/电子/自动化/软件等相关专业,kanzhun有AI工程优化经验的优先;直聘 2、精通C/C++,精来自BOSS直聘通算法与数据结构,熟悉Python; 3、熟练GPU的高性能计算优化技术,深入理解计算机体系结构,熟悉并行计算优化、访存优化,低比特计算等; 4、具备丰富的基于CUDA的GPU性能优化经验; 5、了解深度学习算法基本原理,熟悉神经网络基本架构和各算子计算方式,了解至少一种深度学习训练框架及其模型文件的解析,如Pytorch、Tensorflow; 6、熟悉TensorRT-LLM、ORCA、VLLM等; 7、了解主流LLM 、Diffusion Model,有LLM 、Diffusion kanzhunModel加速优化经验者优先。

技能解析

专有技能
  • 编写代码
  • 设计文档
  • C++语言
  • SOCKET
  • 客户培训
  • 系统调试
  • 开发和调试
  • 代码编写
  • 开发工具
  • 支持工作
  • 单元测试
  • 应用程序开发
  • 程序开发
  • 熟悉多线程
相同技能
  • C/C++

数据来自CSL职业科学研究室

技能解析

专有技能
  • 训练框架
  • 性能优化经验
  • 深度学习
  • 神经网络
  • 深度学习算法
  • 深度合作
  • 数据结构
  • CUDA
  • 基本原理
  • 优化技术
  • 性能优化
  • 学习算法
相同技能
  • C/C++

数据来自CSL职业科学研究室

工作时间

上午09:00   -   下午06:00

公司福利

  • 交通补助
  • 高温补贴
  • 餐补
  • 五险一金
首页 | 上海招聘 · C/C++招聘 | 上海C/C++招聘 | 上海力融C++高级软件工程师招聘 | 上海力融C++高级软件工程师 怎么样
更新于 2024-10-20