职位&公司对比

招聘中

大模型算法

-K·薪
某大型通信信息技术上市公司
职位关闭

大语言模型训练性能优化工程师

-K·薪
某计算机软件公司

职位详情

  • 南京
  • 5-10年
  • 本科
  • 模型训练
  • 模型管理
  • 在线推理
  • 精调
  • AI平台训练
  • CV模型
  • 数据标注

岗位职责: 1、负责人工智能领域前沿算法的研发、探索人工智能的创新应用; 2、负责大模型工具链平台研发,支持大模型数据清洗、训练、编译量化、推理、评估等功能; 3、负责NLP/CV/跨模态基础大模型研发,行kanzhun业大模型知识注入、精调、推理等研发工作; 4、负责大模型训练、推理加速技术研究,解决千亿级大模型训练及推理加速关键技术问题; 5、负责CV领域目标检测、图像定位、语义分割、多目标跟踪boss等算法研发。 任职要求: 1、计算机、人工智能、通信或电子相关专业,有1年以上大模型研发经验; 2、熟悉Tensorflow、Pytorch等AI常用算法和框架,对神经网络关键算子有深入理解; 3、精通深度学习算法、NLP、CV和多模态等大模型网络结构和原理, 4、有大模型研发经验者优先,如GPT系列、BERT、T5等模型的开发和优化,对大模型的训练、评估、优化以及微调kanzhun具备实际落地经验。 5、熟悉Python、C++等编程预研;BOSS直聘 6、学习能力强、善于沟通、对技术创新充满激情,有较强的成导向。 职位信息 工作地点 上海市-浦东新区, 江苏-南京市, 天津市

职位详情

  • 南京
  • 不限
  • 本科
  • AI框架 优化 大模型
  • cuda

岗位职责 大语言模型训练性能优化,包括但不限直聘于Megatron-LM,DeepSpeed,PyTor来自BOSS直聘ch等框架、网络通信、算子等优化方向; 具体模型优化加速,包括但不限于部署模型训练环境、profiling定位模型训练性能瓶颈、分析优化方向、并行boss策略/算子优化等; 大语言模型前沿发展的调研,跟踪与适配,包括但不限于前沿模型发展、框架、实现技术等; 任职要求(必须) 本科以上学历,计算机相关专业,熟悉AI领BOSS直聘域基本知识 熟练使用Python编程,熟悉C++/CUDA编程 熟悉PyTorch、Megatron-LM等主流框架 熟悉DP、TP、PP、EP、CP等大模型并行策略 熟悉主流Transformer类大语言模型结构 对大语言模型技术方向有热情

技能解析

专有技能
  • 开发和优化
  • 技术问题
  • 深度学习
  • 关键技术
  • 技术研究
  • 神经网络
  • 深度学习算法
  • 数据清洗
  • 研发工作
  • 技术创新
  • 善于沟通
  • 常用算法
  • 学习算法
  • 研发经验
  • 学习能力
  • 电子相关
相同技能
  • 模型训练

数据来自CSL职业科学研究室

技能解析

专有技能
  • CUDA
  • 性能优化
  • 熟悉C++
  • 网络通信
相同技能
  • 模型训练

数据来自CSL职业科学研究室

公司福利

  • 五险一金
  • 补充医疗保险
  • 定期体检
  • 加班补助
  • 年终奖
  • 股票期权
  • 带薪年假
  • 员工旅游
  • 免费班车
  • 餐补
  • 通讯补贴
  • 交通补助
  • 节日福利
  • 零食下午茶

备注

职位发布者未明确表明公司信息,具体可咨询职位发布人进行确认。

备注

职位发布者未明确表明公司信息,具体可咨询职位发布人进行确认。

更新于 2025-03-24