职位描述
- NLP
- chatGPT/LLaMA/GLM
- 大模型微调
- Java
- C++
- Python
- 多模态/语言大模型
- 视觉算法
1、负责 LLM 在软件研发领域的应用与落地,采用包括但不限于LLM、Agent/Multi-agent、 Tool Learning、RAG、RLHF、多模态,质检,图像,识别,分割,SAM,Stable Diffusion,DETR,ASR,视频等技术,探索大模型和软件研发领域的结合,实现在业务中的应用落地。
2、负责算法模型研发,包含但不限于Embedding、Pre-train、SFT、Self-instruct;
3、参与领域模型的全流程工作,包括但不限于数据、训练、评测、推理部署,保证数据的高质量和有效性;
4、探索Agent在复杂任务中的应用,实现基于LLM的复杂任务在软件研发领域场景的应用落地;
5、负责多模态大模型多领域创新,包括语医疗、金融、客服等场景的应用;
6、负责整体技术方案输出和POC验证;
7、参与大模型应用链路升级,优化大模型微调、推理等关键环节,打造低成本+高性能+有智能感的解决方案;
职位要求:
1、 硕士及以上学历,模式识别、语音、计算机科学或相关专业背景;
2、对NLP主流大模型如chatGPT/LLaMA/GLM等的原理和差异有深入的理解。有百亿/千亿NLP大模型训练调优经验优先,熟悉大模型训练与加速框架诸如Deepspeed/Megatron-LM/vLLM等优先,有能力使用Lora/QLora等方案进行大模型参数高效微调;
3、热衷于技术创新,善于突破既有框架做出改变,善于运用有限资源针对具体问题拿到结果;
4、具备良好的抗压能力、沟通能力和协作精神,热衷探索新兴技术。
5、熟悉Java、C++或Python编程开发语言,熟悉分布式应用架构和主流中间件技术等,熟悉性能分析和优化等;
6、熟练掌握计算机视觉、多模态、自然语言处理、机器学习等相关领域的基本理论和算法;
7、具有很好的表达能力,很好的抗压能力和团队合作能力。热衷于技术创新,善于突破既有框架做出改变,善于运用有限资源针对具体问题拿到结果。对大数据人工智能技术应用到实际业务场景产生商业价值具有强烈的热情。
加分项:
1、在多模态/语言大模型、计算机视觉领域有科研或实践经验,在国际顶级会议/期刊发表过高质量论文。
认证资质

张先生
竞争力分析


BOSS 安全提示
BOSS直聘严禁用人单位和招聘者用户做出任何损害求职者合法权益的违法违规行为,包括但不限于扣押求职者证件、收取求职者财物、向求职者集资、让求职者入股、诱导求职者异地入职、异地参加培训、违法违规使用求职者简历等,您一旦发现此类行为, 请立即举报
了解更多职场安全防范知识精选职位
页面更新时间:2025-02-10