各大行业职位任你选
首次验证通过即注册BOSS直聘账号职位描述
- 大模型
- 推理优化
基础信息
招聘批次:研究型实习生
毕业起止时间要求:2025.10.01-2028.07.31
面试地点:北京、杭州
工作地点:北京、杭州
发布时间:2024.07.23
职位描述
研究领域: 人工智能 项目简介: 大模型推理受限于自回归的生成方式限制,GPU资源没有得到充分的利用,计算加速以及模型压缩是当前主流的两种技术。前者主要从kv cache、falsh decoding、tp、投机采样等角度提升计算/io速度;后者主要从量化、蒸馏、剪枝、attention改造等角度减少计算总量。但是目前在超长上下文推理背景下,融合计算加速和模型压缩的技术是保证高吞吐高性能大模型推理服务的关键。
职位要求
研究领域: -目前正在攻读计算机科学或相关STEM领域的学士,硕士或博士学位
-具有一种或多种通用编程语言的经验,包括但不限于: Python、Pytorch、TensorFlow、vLLM、TensorRT-LLM等;
-具有上述研究领域的相关经验,包括行业经验或作为参与实验室研究 优先录用:
-对技术研究充满热情,具有产生新思想和创新的能力; 在自学,问题分析和解决方面表现出色
-在国际会议上或核心期刊发表一份或多份出版物或论文,比如算法顶会ICML/ICLR/NIPS、ACL/EMNLP/KDD、CVPR/ICCV/ECCV或系统顶会WWW、SIGMOD/VLDB、ICSE/ASE、ATC/OSDI/ASPLOS、MLSys等
-至少4个月的全职工作
投递方式
邮箱:*********************
蚂蚁招聘官网:https://talent.antgroup.com/campus-position?positionId=24072301026338
胡先生 本周活跃
竞争力分析
BOSS 安全提示
BOSS直聘严禁用人单位和招聘者用户做出任何损害求职者合法权益的违法违规行为,包括但不限于扣押求职者证件、收取求职者财物、向求职者集资、让求职者入股、诱导求职者异地入职、异地参加培训、违法违规使用求职者简历等,您一旦发现此类行为, 请立即举报
了解更多职场安全防范知识公司介绍
我们通过科技创新,助力合作伙伴,为消费者和小微企业提供普惠便捷的数字生活及数字金融服务;
持续开放产品与技术,助力企业的数字化升级与协作;
在全球广泛合作,服务当地商家和消费者实现“全球收”、“全球付”和“全球汇”。
工商信息
- 公司名称支付宝(杭州)信息技术有限公司
- 法定代表人陈亮
- 成立日期2016-07-07
- 企业类型有限责任公司(非自然人投资或控股的法人独资)
- 经营状态存续
- 注册资金10000万人民币
工作地址
点击查看地图
精选职位
更新于:2024-12-13