职位&公司对比

招聘中
某大型通信/网络设备公司
招聘中

大模型算法

-K·薪
某知名运营商公司

职位详情

  • 南京
  • 5-10年
  • 硕士
  • NLP
  • 大模型SFT训练
  • 大模型训练性能调优

岗位职责: 1、负责知识工程相关算法研究、开发、部署与优化,包括但不限于知识图谱构建、知识推理、知识问答等 2、深入理解业务需求,完成能源垂kanzhun直领域大模型精调与轻量化部署,构建Agent应用,支撑研究院研发提效和产品智能运维工作 3、跟踪并研究知识工程、自然语言处理相关领域前沿技术动态,为团队技术发展提供建议和支 岗位要求: 1、计算机科学、人工智能、数学等相关专业硕士及以上学历,5年以上自然语言处理/大模型相关领域工作经验 2、熟悉知识工程、自然语言处理等相关领域基本概念和技术原理 3、熟练掌握Python,精通TensorFlow、PyTorch等AI常用算法和框架 4、熟悉大模型SFT训练方法boss,包括LoRA、P-tuning、Prefix-Tuning等,具有大模型训练性能调优经验 5、了解常见的大模型能力评测Benchmark,对大模型能力评测体系和系统有基本了解 6、具有垂直领域 LangChain/LLaMAIndex/AutoGPT 应用开发落地经验者优先 7、对神经网络关键算子的计算和优化有深入理解,有模型量化、稀疏化经验者优先

职位详情

  • 南京
  • 3-5年
  • 硕士
  • 模型训练
  • 模型推理
  • 大模型
  • 自然语言

方向一:模型训练 1、负责大模型训练研发。构建训练数据集,运用SFT、RLHF等技术对大模型进行微调,满足大模型领域场景落地需求; 2、负责大模型推理优化。运用prompt工程、模型蒸馏、推理加速、超长上下文等技术,优化大模型性能,提升大模型落地成效; 3、负责大模型安全研究。降低大模型输出幻觉,提高大模型安全性及稳定性,解决大模型可控可信度不足问题; 4、参与大模型产品化落地,提供大模型产品化、公有云和私有云落地方案。 任职资格 1、计算机、人工智能等专业,硕士及以上学历,kanzhun具备5年以上算法工作经验; 2、熟练掌握主流大模型,包括不限于GPT-series、LLaMA、GLM等预训练模型; 3、精通大模型微调、自监督学习、注意力机制、Transformer、多模态学习、模型蒸馏、推理加速等技术; 4、精通Python/C++等编程语言,熟练掌握Pytorch/Tensorflow等深度学习框架、Deepspeed/Megatron等分布式训练框架; 5、具备优秀的分析问题和解决问题能力,勇于挑战困难问题; 6、具备良好的团队协作和沟通能力,能够带领团队达成大模型目标任务; 7、具备超大规模(集群千卡+/大模型100B+)训练、调优经验者优先; 8、在英文期刊和学术顶会上发表过学术论文者优先。 方向一:大模型应用方向 1、负责基于开源TEXT2SQL大模型和移动自有九天出行大模型的应用开发,实现基于自然语言交互的时空数据建模、挖掘和分析,持续优化梧桐洞察和触达大数据产品体验和服务效率。 2、针对开源TEXT2SQL大模型和移动自有九天出行大模型进行推理优化,提高模型性能和准确性,确保在实际业务场景中稳定应用。 直聘3、负责大模型应用的部署和优化,包括模型集成、性能调优、错误处理等方面,确保模型在实际环境中的高效运行。 4、参与移动自有来自BOSS直聘出行大模型的数据集准备,构建画像属性、流动行为等用户建模数据,优化时空三元组(用户、基站、时间)数据质量,构建语义标注真值库等。 5、负责梧桐洞察和触达产品数智化升级技术方案,推进大模型在行业数智解决方案中创新应用。 任职资格 1、计算机、大数据、人工智能等相关专业硕士及以上学历,具备3年以上软件开发经验; 2、深入理解自然语言处理、数据库查询优化和机器学习等相关知识,掌握TensorFlow、PyTorch等深度学习框架,熟悉动态图数据神经网络架构(TGN)或TEXT2SQL技术框架或类似项目者优先。 3、熟练掌握文本、多模态等非结构化数据处理以及数据清洗、特征提取和数据增强等技术,熟悉运营商位置信令数据处理者优先。 4、具备良好的数据分析和解决问题的能力,对解决具有挑战性问题充满激情。 5、具有良好的团队合作精神和沟通能力,能够牵头带领团队承担大模型应用与落地任务。 方向二:模型服务平台方向 1、负责开源大模型、移动自有基础大模型的调优(如SFT、RLHF等)、训练范式优化及性能优化; 2、负责大模型prompt工程、模型蒸馏、推理加BOSS直聘速、超长上下文等优化技术研究; 3、负责大模型安全与幻觉研究,提高大模型安全性及稳定性,解决大模型可控可信度不足问题; 4、参与大模型的产品落地,包括基于反馈的算法调优、算法创新、系统评测等。 任职资格 1、计算机、人工智能、自然语言处理等相关专业硕士及以上学历,具备5年以上自然语言处理算法经验; 2、熟练掌握语言大模型相关算法,掌握GPT-series、LLaMa等预训练模型,精通微调模型、自监督学习、注意力机制、Transformer、多模态学习等技术; 3、熟练掌握Python、C++等编程语言,熟悉常用的Pytorch/Tensorflow/PaddlePaddle/MindSpore等深度学习算法,掌握Deepspeed/Megatron等分布式训练框架; 4、优秀的分析问题和解决问题的能力,对解决具有挑来自BOSS直聘战性的问题充满激情; 5、具有良好的团队合作精神和沟通能力,能够牵头带领团队承担大模型应用与落地任务; 6、具备超大规模(千卡及以上)集群进行大模型(100B+)训练及调优经验者优先; 7、有优秀的英文学术论文写作能力,在英文期刊和学术顶会上发表过学术论文者优先; 8、对人工智能领域的前沿研究和算法有很高的热情,渴望用人工智能技术解决商业世界的难题。

技能解析

专有技能
  • 技术原理
  • 工程相关
  • 技术发展
  • 提供建议
  • 知识图谱
  • 训练方法
  • 算法研究
  • 常用算法
  • 运维工作
  • 深入理解业务
相同技能
  • 性能调优
  • 应用开发
  • 自然语言
  • 模型训练
  • 神经网络
  • 相关算法

数据来自CSL职业科学研究室

技能解析

专有技能
  • 深度学习框架
  • 训练框架
  • 数据质量
  • 编程语言
  • 用户建模
  • 技术方案
  • 技术框架
  • 技术研究
  • 带领团队
  • 良好的数据分
  • 数据分析
  • 优秀的分析
  • 分析问题
  • 沟通能力
  • 机器学习
  • 优化技术
  • 分析问题和解决问题的能力
  • 团队协作
  • 开发经验
  • 性能优化
  • 合作精神
  • 学习算法
  • 数据处理
  • 解决问题能力
  • 软件开发
  • 分析和解决问题的能力
  • 团队合作精神
  • 数据产品
  • 良好的数据分析
  • 解决问题的能力
  • 深度学习
  • 解决问题
  • 优秀的英文
  • 良好的团队协
  • 深度学习算法
  • 团队合作
  • 数据清洗
  • 写作能力
  • 解决方案
  • 数据建模
  • 分析和解决问题
  • 人工智能等
相同技能
  • 性能调优
  • 应用开发
  • 自然语言
  • 模型训练
  • 神经网络
  • 相关算法

数据来自CSL职业科学研究室

备注

职位发布者未明确表明公司信息,具体可咨询职位发布人进行确认。

备注

职位发布者未明确表明公司信息,具体可咨询职位发布人进行确认。

更新于 2024-12-02