招聘中

爬虫工程师

15-30K·16薪

北京 1-3年 本科

...
生日福利节日福利免费工装团建聚餐零食下午茶餐补包吃带薪年假股票期权年终奖定期体检补充医疗保险五险一金定期团建
生日福利节日福利免费工装团建聚餐零食下午茶餐补包吃带薪年假股票期权年终奖定期体检补充医疗保险五险一金定期团建
爬虫工程师 15-30K·16薪
...
生日福利节日福利免费工装团建聚餐零食下午茶餐补包吃带薪年假股票期权年终奖定期体检补充医疗保险五险一金定期团建
生日福利节日福利免费工装团建聚餐零食下午茶餐补包吃带薪年假股票期权年终奖定期体检补充医疗保险五险一金定期团建
智谱华章 查看所有职位

各大行业职位任你选

首次验证通过即注册BOSS直聘账号
+86
已阅读并同意BOSS直聘《用户协议》 《隐私政策》,允许BOSS直聘统一管理本人账号信息

公司基本信息

不需要融资

100-499人

互联网

查看全部职位
计算

职位描述

  • JS逆向
  • 反爬
  • APP逆向
  • 数据采集
岗位描述:
1.负责AMiner产品的科技类数据、产业类数据采集。包括不限于论文、专利、咨询、智库等。
2.负责大模型的语料数据采集,包括不限于Code、文章、字幕、评论等。
3.负责全球化信息采集平台的开发,完成并维护调度、代理、解析等功能。
4.对于网页数据、pdf数据等进行解析。

任职要求:
【必要条件】
1.近期2年以上爬虫经验,对最新爬虫动向熟悉;
2.精通JS逆向,熟悉常加解密算法,有抖音、小红书、快手等主流网站web端采集经验;
3.有APP逆向经历,熟悉反编译工具jadx、jeb;熟悉Xposed,Frida 等Hook框架, 熟悉 Android 系统架构,有Xposed模块编写经验;
4.精通网页抓取原理及技术,熟练掌握正则表达式,xpath,cssBeautifulsoup等网页解析技术;熟练从结构化和非结构化的数据中获取信息;
5.精通Python,具备扎实的编码能力,熟悉Linux环境,了解基本的指令;
6.熟悉常用库mongodb、mysql、kafka、redis、Elasticsearch等;熟悉数据库性能优化与常见缓存技术与策略;
7.熟悉tcp,http协议原理;熟悉ajax工作原理;熟悉fiddler,charles等抓包工具;熟悉常见反爬封禁策略,并具备相关的实战经验;
8.熟练掌握http/https等网络通信原理;对加密、解密等原理有一定的了解。
【加分项】
1.熟悉scrapy爬虫框架;
2.二开发scrapy爬虫框架;
3.验证码处理经验(极验滑块、点选,google recaptcha、百度旋转验证码);
4.大规模分布式采集经验。

程女士 在线

智谱华章·HR

竞争力分析

加载中...
个人综合排名:人中排名第
一般 良好 优秀 极好

BOSS 安全提示

BOSS直聘严禁用人单位和招聘者用户做出任何损害求职者合法权益的违法违规行为,包括但不限于扣押求职者证件、收取求职者财物、向求职者集资、让求职者入股、诱导求职者异地入职、异地参加培训、违法违规使用求职者简历等,您一旦发现此类行为, 请立即举报

了解更多职场安全防范知识

公司介绍

智谱AI致力于打造新一代认知智能大模型,专注于做大模型的中国创新。公司于2020年底开始研发 GLM 预训练架构,并训练了百亿参数模型GLM-10B,2021年利用MoE架构成功训练出万亿稀疏模型,于2022年合作研发了双语千亿级超大规模预训练模型GLM-130B,并基于此千亿基座模型打造大模型平台及产品矩阵。
公司践行Model as a Service(MaaS)的市场理念,推出大模型MaaS开放平台(https://open.bigmodel.cn/),基于领先的千亿级多语言、多模态预训练模型,打造高效率、通用化的“模型即服务”AI开发新范式,实现服务效率的提升。
2023年,智谱AI推出了千亿基座的对话模型ChatGLM,并开源单卡版模型ChatGLM-6B,使得研究者和个人开发者进行微调和部署成为可能。2023年6月,ChatGLM2正式发布,千亿基座对话模型全系升级,提供丰富尺寸,适用于多种场景。在细分领域方面,团队打造了AIGC模型及产品矩阵,包括高效率代码模型CodeGeeX、高精度文图生成模型CogView、多模态对话语言模型VisualGLM-6B等。
通过认知大模型链接物理世界的亿级用户,智谱AI基于完整的模型生态和全流程技术支持,为千行百业带来持续创新与变革,加速迈向通用人工智能的时代。官网请见(zhipuai.cn)
查看全部

工商信息

  • 公司名称北京智谱华章科技有限公司
  • 法定代表人刘德兵
  • 成立日期2019-06-11
  • 企业类型有限责任公司(外商投资、非独资)
  • 经营状态存续
  • 注册资金3304.8422万人民币
查看全部

工作地址

北京海淀区搜狐网络大厦10
公司地址

点击查看地图

精选职位

页面更新时间:2024-12-24

快速完善简历,与Boss开聊

与在线Boss直接聊,最快当天拿offer

快速完善信息