职位&公司对比

招聘中

AI语音合成专家

-K·薪
  • 消费电子
  • 不需要融资
招聘中
  • 通信/网络设备
  • 未融资

职位详情

  • 南京
  • 5-10年
  • 本科
  • 语音合成

上海/南京 岗位职责:1、负责音频大模kanzhun型的研究,包括但不限于:拟人化TTS、个性化TTS在业务中落地,优化效果; 2、负责音乐大模型的研究,实现AI作曲、音乐编boss辑在业务中落地,优化效果; 3、配合工程人员实现语音合成、语音转换、语音克隆等算法的产品落地,优化bad case 4、持续跟进业界前沿算法发展方向,配合公司战略,完成语BOSS直聘音方向的技术规划与研直聘发落地; 任职要求: 1、全日制211硕士及以上学历,计算来自BOSS直聘机、信号处理、人工智能相关专业5年以上工作经历。 2、熟悉常用语音合成算法,如FastSpeech、Tacotron、Vits、HifiGAN等。 3、熟悉SoundStorm、NS1/2/3、AudioLDM、VallE、XTTS、Encodec、Vocos等主要大模型算法。 4、熟练使用Pytorch/Tensorflow框架,扎实的Python/C/C++编程功底,落地经验者优先。 5、较强的自学能力和独立思考能力,善于思考和表达自己的想法,同时又具备良好的团队合作精神。

职位详情

  • 南京
  • 5-10年
  • 硕士
  • 语音算法
  • 团队管理

【岗位职责】 1. 跟进国内外最新技术,结合业务需求和公司发展,整体把控算法研发内容和进度,确保业务的正常开展。 2. 负责声纹识别技术的研发和工程化开发boss,以及研发团队的常工作的分配与指导。 3. 重点负责语音相关算法研究和落地,包括但不限于声纹识别、有效音检测、合成音检测、语音识别等。 4. 理解用户需求,进行算法的改进和验证,并将成果应用于工业级声纹识别系统。 【岗位要求】 1. 计算机、信号处理等相关专业硕士及以上学历,且拥有带领10人及以上的团队管理经验。 2. 数学功底良好,具有较强的代码编写能力,能够流畅阅读英文文献,英语可作为工作语言。 3. 具有创新力和批判性思维,深度学习经验丰富,熟悉市面kanzhun上主流的Ai语音处理算法,如HMM,CTC,ECAPA-TDNN,LAS,wav2vec等。 4. 具备较好的C++或Python编程能力,熟悉Pytorch,Kaldi等工具。优秀的BOSS直聘问题分析与解决能力,具备海量语音数据进行标注及算法模型优化的力。 5 发表过InterSpeech、ICASSP、CVPR等领域论文者尤佳。

技能解析

专有技能
  • C/C++
  • 团队合作精神
  • 独立思考
  • 合作精神
  • C++编程
  • 团队合作
  • 语音合成
  • 模型算法
  • 自学能力
相同技能
  • 信号处理

数据来自CSL职业科学研究室

技能解析

专有技能
  • CASS
  • 团队管理经验
  • 团队管理
  • 阅读英文
  • 批判性思维
  • 深度学习
  • 相关算法
  • 编程能力
  • 流畅阅读
  • 代码编写
  • CAPA
  • 数学功底
  • 分析与解决
  • 理解用户需求
  • 英文文献
  • 具有创新
  • 管理经验
  • 算法研究
  • 用户需求
  • 英语可作为工作语言
  • 问题分析
  • 算法模型
  • 解决能力
相同技能
  • 信号处理

数据来自CSL职业科学研究室

工作时间

上午08:30   -   下午06:00
双休弹性工作

工作时间

上午08:30   -   下午05:30
双休不加班

公司福利

  • 五险一金
  • 通讯补贴
  • 节日福利
  • 免费班车
  • 零食下午茶
  • 带薪年假
  • 加班补助
  • 股票期权
  • 年终奖
  • 定期体检
  • 补充医疗保险

公司福利

  • 生日福利
  • 节日福利
  • 通讯补贴
  • 零食下午茶
  • 餐补
  • 带薪年假
  • 法定节假日三薪
  • 绩效奖金
  • 年终奖
  • 五险一金
更新于 2025-01-04