职位&公司对比

招聘中
  • 电子商务
  • D轮及以上
招聘中

大模型多媒体音频语音算法

-K·薪
某小型基于大模型技术的AI native TOC产品公司

职位详情

  • 北京
  • 不限
  • 不限
  • 预训练
  • NLP
  • BERT

岗位职责 小红书招聘多名NLP算法工程师,从事预训练模型、以及在搜索、电商、安审等业务中的落地。 岗位基本要BOSS直聘求 1. 熟悉自然boss语言处理常见算法与模型,来自BOSS直聘具备度学习技术在NLP领域的应用实践,有预训练模型经验。 2. 做事踏实务实,沟通交流能力合格,能解决实际业务问题。 工作地点:北京或上海 薪资 职级和薪资与候选人的工作经验相匹配,一事一来自BOSS直聘议,range很大。

职位详情

  • 北京
  • 不限
  • 不限
  • audio
  • 音频算法
  • 语音识别
  • 语音增强
  • 音频处理
  • 多模态
  • 多媒体

1、支持研发基于大模型的多媒体算法kanzhun研究和落地,包括但是不限于视频理解,画质增强,质量评价、视频处kanzhun理和增强以及视频压缩; 2、支持编码前后处理相关算法研究和落地; 3、支持各类异构平台上算法的加速与优化,包括但不限于量化、蒸馏、剪枝等; 4、支持视频端到端全链体验优化; 5、支持AIGC大模型在底层视觉、画质、压缩等多媒体方向的探索以及落地。6、支持多模态大模型相关算法的性能优化以及加速; 7、支持多模态大模型的算法在多媒体业务中落地,在图文、点播、直播等业务中发掘应用场景; 职位要求 1、计算机、通信、电子、数学等相关专业硕士或博士; 2、精通常见的图像、视频处理算法,有一定的视频解码背景; 3、掌握常见视觉算法,如分类、检测、分割等; 4、精通视觉AIGC相关的算法,包括GAN、VAE、Diffusion Model等; 5、精通audio方向, 能handle的了TTS,diffusion的试验,;丰富的数字信号处理和人工智能/深度学习系统研发经验:降噪/回声/去混响等音频前处理,声纹/唤醒,声音事件检测,语音增强、语音识别,自然语言处理等一个或几个领域有项目实践;7、熟悉数据结构和算法, 深度网络模型设计和调熟,练掌握Kaldi, TensorFlow, Pytorch等开源工具。有大规模训练数据集上进行模型训练和探索经验优先; 8、良好的团队合作意识和学习能力,有业务意识,对语音和音频领域技术有热情; 9、有较强科研经验优先、在CV直聘PR、ICCV、ECCV等顶级会议、期刊发表过论文者优先。

技能解析

专有技能
  • 沟通交流能力
  • 交流能力
  • 算法工程
  • 业务问题
  • 沟通交流
相同技能
  • 深度学习
  • 自然语言

数据来自CSL职业科学研究室

技能解析

专有技能
  • 数字信号
  • 合作意识
  • 数据结构和算法
  • 数据结构和算
  • 相关算法
  • 团队合作
  • 信号处理
  • 数据结构
  • 数字信号处理
  • 视觉算法
  • 熟悉数据结构
  • 算法研究
  • 熟悉数据
  • 模型设计
  • 性能优化
  • 模型训练
  • 团队合作意识
  • 研发经验
  • 学习能力
相同技能
  • 深度学习
  • 自然语言

数据来自CSL职业科学研究室

工作时间

上午10:00   -   下午07:00

公司福利

  • 生日福利
  • 住房补贴
  • 团建聚餐
  • 零食下午茶
  • 餐补
  • 包吃
  • 带薪年假
  • 加班补助
  • 股票期权
  • 年终奖
  • 定期体检
  • 五险一金

公司福利

  • 员工旅游
  • 带薪年假
  • 节假日加班费
  • 年终奖
  • 五险一金

备注

职位发布者未明确表明公司信息,具体可咨询职位发布人进行确认。

更新于 2025-01-08