招聘中

高吞吐高性能大模型推理加速关键技术研究

300-500元/天

北京 4天/周 4个月 硕士

...
五险一金定期体检加班补助全勤奖年终奖股票期权带薪年假员工旅游免费班车餐补通讯补贴交通补助包吃节日福利住房补贴零食下午茶
五险一金定期体检加班补助全勤奖年终奖股票期权带薪年假员工旅游免费班车餐补通讯补贴交通补助包吃节日福利住房补贴零食下午茶
高吞吐高性能大模型推理加速关键技术研究 300-500元/天
...
五险一金定期体检加班补助全勤奖年终奖股票期权带薪年假员工旅游免费班车餐补通讯补贴交通补助包吃节日福利住房补贴零食下午茶
五险一金定期体检加班补助全勤奖年终奖股票期权带薪年假员工旅游免费班车餐补通讯补贴交通补助包吃节日福利住房补贴零食下午茶
蚂蚁集团 查看所有职位

各大行业职位任你选

首次验证通过即注册BOSS直聘账号
+86
已阅读并同意BOSS直聘《用户协议》 《隐私政策》,允许BOSS直聘统一管理本人账号信息

公司基本信息

D轮及以上

10000人以上

互联网

查看全部职位
计算

职位描述

  • 大模型
  • 推理优化
高吞吐高可用大模型推理加速关键技术研究
基础信息
招聘批次:研究型实习生
毕业起止时间要求:2025.10.01-2028.07.31
面试地点:北京、杭州
工作地点:北京、杭州
发布时间:2024.07.23
职位描述
研究领域: 人工智能 项目简介: 大模型推理受限于自回归的生成方式限制,GPU资源没有得到充分的利用,计算加速以及模型压缩是当前主流的两种技术。前者主要从kv cache、falsh decoding、tp、投机采样等角度提升计算/io速度;后者主要从量化、蒸馏、剪枝、attention改造等角度减少计算总量。但是目前在超长上下文推理背景下,融合计算加速和模型压缩的技术是保证高吞吐高性能大模型推理服务的关键。
职位要求
研究领域: -目前正在攻读计算机科学或相关STEM领域的学士,硕士或博士学位
-具有一种或多种通用编程语言的经验,包括但不限于: Python、Pytorch、TensorFlow、vLLM、TensorRT-LLM等;
-具有上述研究领域的相关经验,包括行业经验或作为参与实验室研究 优先录用:
-对技术研究充满热情,具有产生新思想和创新的能力; 在自学,问题分析和解决方面表现出色
-在国际会议上或核心期刊发表一份或多份出版物或论文,比如算法顶会ICML/ICLR/NIPS、ACL/EMNLP/KDD、CVPR/ICCV/ECCV或系统顶会WWW、SIGMOD/VLDB、ICSE/ASE、ATC/OSDI/ASPLOS、MLSys等
-至少4个月的全职工作
投递方式
邮箱:*********************
蚂蚁招聘官网:https://talent.antgroup.com/campus-position?positionId=24072301026338

胡先生 本周活跃

蚂蚁集团·算法

竞争力分析

加载中...
个人综合排名:人中排名第
一般 良好 优秀 极好

BOSS 安全提示

BOSS直聘严禁用人单位和招聘者用户做出任何损害求职者合法权益的违法违规行为,包括但不限于扣押求职者证件、收取求职者财物、向求职者集资、让求职者入股、诱导求职者异地入职、异地参加培训、违法违规使用求职者简历等,您一旦发现此类行为, 请立即举报

了解更多职场安全防范知识

公司介绍

蚂蚁集团起步于2004年诞生的支付宝,源于一份为社会解决信任问题的初心,经过十九年的发展,已成为世界领先的互联网开放平台。
我们通过科技创新,助力合作伙伴,为消费者和小微企业提供普惠便捷的数字生活及数字金融服务;
持续开放产品与技术,助力企业的数字化升级与协作;
在全球广泛合作,服务当地商家和消费者实现“全球收”、“全球付”和“全球汇”。
查看全部

工商信息

  • 公司名称支付宝(杭州)信息技术有限公司
  • 法定代表人陈亮
  • 成立日期2016-07-07
  • 企业类型有限责任公司(非自然人投资或控股的法人独资)
  • 经营状态存续
  • 注册资金10000万人民币
查看全部

工作地址

北京海淀区丽金智地中心1号楼
公司地址

点击查看地图

精选职位

更新于:2024-12-13

快速完善简历,与Boss开聊

与在线Boss直接聊,最快当天拿offer

快速完善信息