各大行业职位任你选
首次验证通过即注册BOSS直聘账号职位描述
- JS逆向
- 反爬
- APP逆向
- 数据采集
1.负责AMiner产品的科技类数据、产业类数据采集。包括不限于论文、专利、咨询、智库等。
2.负责大模型的语料数据采集,包括不限于Code、文章、字幕、评论等。
3.负责全球化信息采集平台的开发,完成并维护调度、代理、解析等功能。
4.对于网页数据、pdf数据等进行解析。
任职要求:
【必要条件】
1.近期2年以上爬虫经验,对最新爬虫动向熟悉;
2.精通JS逆向,熟悉常加解密算法,有抖音、小红书、快手等主流网站web端采集经验;
3.有APP逆向经历,熟悉反编译工具jadx、jeb;熟悉Xposed,Frida 等Hook框架, 熟悉 Android 系统架构,有Xposed模块编写经验;
4.精通网页抓取原理及技术,熟练掌握正则表达式,xpath,cssBeautifulsoup等网页解析技术;熟练从结构化和非结构化的数据中获取信息;
5.精通Python,具备扎实的编码能力,熟悉Linux环境,了解基本的指令;
6.熟悉常用库mongodb、mysql、kafka、redis、Elasticsearch等;熟悉数据库性能优化与常见缓存技术与策略;
7.熟悉tcp,http协议原理;熟悉ajax工作原理;熟悉fiddler,charles等抓包工具;熟悉常见反爬封禁策略,并具备相关的实战经验;
8.熟练掌握http/https等网络通信原理;对加密、解密等原理有一定的了解。
【加分项】
1.熟悉scrapy爬虫框架;
2.二开发scrapy爬虫框架;
3.验证码处理经验(极验滑块、点选,google recaptcha、百度旋转验证码);
4.大规模分布式采集经验。
程女士 在线
竞争力分析
BOSS 安全提示
BOSS直聘严禁用人单位和招聘者用户做出任何损害求职者合法权益的违法违规行为,包括但不限于扣押求职者证件、收取求职者财物、向求职者集资、让求职者入股、诱导求职者异地入职、异地参加培训、违法违规使用求职者简历等,您一旦发现此类行为, 请立即举报
了解更多职场安全防范知识公司介绍
公司践行Model as a Service(MaaS)的市场理念,推出大模型MaaS开放平台(https://open.bigmodel.cn/),基于领先的千亿级多语言、多模态预训练模型,打造高效率、通用化的“模型即服务”AI开发新范式,实现服务效率的提升。
2023年,智谱AI推出了千亿基座的对话模型ChatGLM,并开源单卡版模型ChatGLM-6B,使得研究者和个人开发者进行微调和部署成为可能。2023年6月,ChatGLM2正式发布,千亿基座对话模型全系升级,提供丰富尺寸,适用于多种场景。在细分领域方面,团队打造了AIGC模型及产品矩阵,包括高效率代码模型CodeGeeX、高精度文图生成模型CogView、多模态对话语言模型VisualGLM-6B等。
通过认知大模型链接物理世界的亿级用户,智谱AI基于完整的模型生态和全流程技术支持,为千行百业带来持续创新与变革,加速迈向通用人工智能的时代。官网请见(zhipuai.cn)
工商信息
- 公司名称北京智谱华章科技有限公司
- 法定代表人刘德兵
- 成立日期2019-06-11
- 企业类型有限责任公司(外商投资、非独资)
- 经营状态存续
- 注册资金3304.8422万人民币
工作地址
点击查看地图
精选职位
页面更新时间:2024-12-24