职位&公司对比

招聘中

大模型多媒体音频语音算法

-K·薪
某小型基于大模型技术的AI native TOC产品公司

职位详情

  • 北京
  • 1-3年
  • 博士
  • 计算机相关专业
  • 深度学习经验
  • 有国际期刊/会议论文发表

与清华大学联合培养博士后招生计划 一、应聘条件: 1、品学兼优,身体健康,无不良记录; 2、获得博士学位不超过3年,或已满足颁发博士学位要求;以及从其他博士后科研流站 (工作站)出站的博士后研究人员,年龄35周kanzhun岁以下; 3、具备全日kanzhun制进站工作条件,不招收在职研究人员。 二、福利待遇 1、业界最前沿科研课题; 2、中国顶级高校教授&行业领军人双导师团队; 3、有竞争力的薪酬待遇和学习成长机会。 三、研究方向boss: 3.1 预训练语言模型及模型小型化技术研究 1、在深度学习、自然语言处理、预训练模型等方向有深入的研究积累; 2、在模型蒸馏、模型量化、训练及推理加速等方面有一定经验; 3、在AI相关领域顶会发表论文不少于 3 篇,熟悉深度学习主流编程框架。 3.2 AIGC方向研究 研究方向包括不限于自然语言生成、图像生成、代码生成、人机对boss话等方向。 1、在深度学习、自然语言处理、计算机视觉等方向有深入的研究积累; 2、有文本、图像生成,或人机对话等相关研究或应用实践经验优先直聘; 3、在AI相关领域顶会发表论文不少于 3 篇,熟悉深度学习主流编程框架。

职位详情

  • 北京
  • 不限
  • 不限
  • audio
  • 音频算法
  • 语音识别
  • 语音增强
  • 音频处理
  • 多模态
  • 多媒体

1、支持研发基于大模型的多媒体算法研究和落地,包括但是不限于视频理解,画质增强,质量评价、视频处理和增强以及视频压缩; 2、支持编码前后处理相关算法研究和落地; 3、支持各类异构平台上算法的加速与优化,包括但不限于量化、蒸馏、剪枝等; 4、支持视频端到端全链路体验优化; 5、支持AIGC大模型在底层视boss觉、画质、压缩等多媒体方向的探索以及落地。6、支持多模态大模型相关算法的性能优化以及加速; 7、支kanzhun持多模态大模型的算法在多媒体业务中落地,在图文、点播、直播等业务中发掘应用场景; 职位要求 1、计算机、通信、电子、数学等相关专业硕士或博士; 2、精通常见的图像、视频处理算法,有一定的视频编解码背景; 3、掌握常见视觉算法,如分类、检测、分割等; 4、精通视觉AIGC相关的算法,包括BOSS直聘GAN、VAE、Diffusion Model等; 5、精通audio方向, 能handle的了TTS,diffusion的试验,;丰富的数字信号处理和人工智能/深度学习系统研发经验:降噪/回声/去混响等音频前处理,声纹/唤醒,声音事件检测,语音增强、语音kanzhun识别,自然语言处理等一个或几个领域有项目实践;7、熟悉数据结构和算法, 深度网boss络模型设计和调熟,练掌握Kaldi, TensorFlow, Pytorch等开源工具。有大规模训练数据集上进行模型训练和探索经验优先; 8、良好的团队合作意识和学习能力,有业务意识,对语音和音频领域技术有热情; 9、有较强科研经验优先、在CVPR、ICCV、ECCV等顶级会议、期刊发表过论文者优先。

技能解析

专有技能
  • 计算机视觉
  • 研究方向
  • 技术研究
相同技能
  • 深度学习
  • 自然语言

数据来自CSL职业科学研究室

技能解析

专有技能
  • 数字信号
  • 合作意识
  • 数据结构和算法
  • 数据结构和算
  • 相关算法
  • 团队合作
  • 信号处理
  • 数据结构
  • 数字信号处理
  • 视觉算法
  • 熟悉数据结构
  • 算法研究
  • 熟悉数据
  • 模型设计
  • 性能优化
  • 模型训练
  • 团队合作意识
  • 研发经验
  • 学习能力
相同技能
  • 深度学习
  • 自然语言

数据来自CSL职业科学研究室

公司福利

  • 员工旅游
  • 带薪年假
  • 节假日加班费
  • 年终奖
  • 五险一金

备注

职位发布者未明确表明公司信息,具体可咨询职位发布人进行确认。

更新于 2025-01-08