职位&公司对比
职位详情
- 北京
- 3-5年
- 本科
- C/C++
- Python
- 并行计算
- 算法工程化经验
- 发表算法相关优秀论文
- 参加算法相关竞赛/获奖
- 训练加速
- 模型并行
- 计算性能分析
职位描述 1. 为了实现自动驾驶领域的突破性成果,将大模型的能力应用到生产环境中,我们正在寻找一名大模型训练加速专家,加入我们的训练加速团队,共同推动训练速度和性能的优化。 2. 作为大规模训练加速专家,将负责boss优化自动驾驶场景下的大规模训练任务,提高训练效率,实现高效、稳定的大模型训练。 职位要求 职位要求: 1. 分析并优化现有训练流程中的性能瓶颈。 2. 研究和实施最先进的训练加速技术,如数来自BOSS直聘据并行、模型并行、混合精度训练等。 3. 优化数据加载和预处理boss过程,减少数据加载延迟。 4. 跟踪业界最新研究动态,评估和整合适用于我们项目的新技术和方法。 5. 与团队其他成员紧密合作,确保项目按时按质完成。 基本要求: 1. 计算机科学、电子工程、人工智能或相关领域的本科以上学位。 2. 在深度学习、计算机视觉或自动驾驶领域有至少 3 年的研究或工程经验。 3. 精通常见训练框架如tensorflow,pytorch等 4. 熟悉模型计算性能分析、问题定位及调试方法。 5. 熟悉深度学习算法或常见 CV 算法。 6. 熟悉深度学习量化方法。 优先考虑: 1. 对自动驾驶行业、环境感知、高精度地图、规划控制等领域有经验者优先。 2. 在顶级会议和期刊发表过相关领域论文者优先。 3. 具有实际项目成功案例,能够展BOSS直聘示训练加速方面的优化成果者优先。
职位详情
- 北京
- 5-10年
- 硕士
- 大模型算法
- 模型加速/性能优化
- 并行计算
- 分布式训练
- 算法工程化经验
- 参加算法相关竞赛/获奖
- 团队管理经验
1、负直聘责火山引擎机器学习训练和推理框架的研发和性能优化,支撑火山引擎机器学习平台和方舟大模型平台的相关需求和架构迭代; 2、负责解决系统高并发、高可靠性、高可扩展性等技术难关; 3、覆盖机器学习系统多个子方向领域的工作,包括:资源调度、任务编排、模型训练、模型推理、模型管理、数据集管理、工作流编排、bossML for System等; 4、负责机器学习系统前瞻技术的调研和引入,比如:最新硬件架构、异构计算系统、GPU 优化技术的引入落地; 5、研究基于机器学习方法,实现对集群/服务资源使用情况的分析和优化。 职位要求 1、有C/C++/Python/Cuda开发经验,熟练使用Linux 系统/ GDB /Nsight等工具,ACM/ICPC/Code来自BOSS直聘forces等获奖者优先; 2、能够从产品思维、机器性能和稳定性、团队协作等多种视角,高标准要求自己的技术方案和每一行代码; 3、对如下一个或多个领域有经验,或者无经验但有浓厚的兴趣(须额外付出自己的时间进行深入研究和直聘探索): a. 大模型系统:基础模型的分布式训直聘练(Scaling Laws)、高效微调(Lora/P-Tuning/RLHF)、推理引擎和优化(并行策略、量化压缩、算子优化等)、Transformer模型结构(Sparse/MoE/LongContext等); b. AI+HPC:并行计算(CPU/Cuda/OpenCL)、通信(NCCL/MPI/RDMA/DPDK)、AI编译器(MLIR/TVM/Trition/LLVM)、Linux OS及Kernel; c. 机器学习算法:各类基于梯度的经典算法与经典模型(ResNet/BERT/GPT/Swin Transformer/MLP-Mixer)、多模态(CLIP/BLIP/miniGPT4)。
技能解析
- 调试方法
- 自动驾驶
- 训练框架
- 性能分析
- 紧密合作
- 计算机视觉
- 深度学习
- 电子工程
- 深度学习算法
- 模型训练
- 学习算法
数据来自CSL职业科学研究室
技能解析
- 机器学习算法
- 可扩展性
- 技术方案
- 学习方法
- C/C++
- 机器学习
- 优化技术
- 分析和优化
- 团队协作
- 性能优化
- 开发经验
- 浓厚的兴趣
- 产品思维
- 模型训练
- 学习算法
数据来自CSL职业科学研究室
工作时间
公司福利
- 通讯补贴
- 带薪年假
- 加班补助
- 股票期权
- 年终奖
- 定期体检
- 补充医疗保险
- 五险一金
公司福利
- 就近租房补贴
- 年度体检
- 免费健身设施
- 家庭关爱假
- 家属自选保险
- 住房补贴
- 团建聚餐
- 餐补
- 带薪年假
- 股票期权
- 绩效奖金
- 年终奖
- 定期体检
- 意外险
- 补充医疗保险
- 五险一金
备注
职位发布者未明确表明公司信息,具体可咨询职位发布人进行确认。