「职位对比」智谱华章爬虫工程师怎么样

爬虫工程师

立即沟通

智谱华章

更换职位

爬虫工程师

立即沟通

硬核聚视

更换职位

招聘中

职位详情

北京
1-3年
本科

JS逆向
反爬
APP逆向
数据采集

岗位描述： 1.负责AMiner产品的科技类数据、产业类数据采集。包括不限于论文、专利、咨询、智库等。 2.负责大模型的语料数据采集，包括不限于Code、文章、字幕、评论等。 3.负责全球化信息采集平台的开发，完成并维护调度、代理、解析等功能。 4.对于网页数据、pdf数据等进行解析。任职要求：【必要条件】 1.近期2年以上爬虫经验，对最新爬虫动向熟悉； 2.精通JS逆向，熟悉常加解密算法，有抖音、小红书、快手等主流网BOSS直聘站web端采集经验； 3.有APP逆向经历，熟悉反编译工具jadx、jeb；熟悉Xposed，Frida 等Hook框架, 直聘熟悉 Android 系统架构，有Xposed模块编写经验； 4.精通网页抓取原理及技术，熟练掌握正则表达直聘式,xpath,cssBeautifulsoup等网页解析技术；熟练从结构化和非结构化的数据中获取信息； 5.精通Python，具备扎实的编码能力，熟悉Linux环境，了解基本的指令； 6.熟悉常用库mongodb、mysql、kafka、redis、Elasticsearch等；熟悉数据库性能优化与常见缓存技术与策略； 7.熟悉tcp，http协议原理；熟悉ajax工作原理；熟悉fiddler，charles等抓包工具；熟悉常见反爬封禁策来自BOSS直聘略，并具备相关的实战经验； 8.熟练掌握http/https等网络通信原理；对加密、解密等原理有一定的了解。【加分项】 1.熟悉scrapy爬虫框架； 2.二开发scrapy爬虫框架； 3.验证码处理经验（极验滑块、点选，google recaptcha、百度旋转验证码）； 4.大规模分BOSS直聘布式采集经验。

职位详情

北京
3-5年
本科

逆向
视频抓取
内容爬取

工作职责： 1. 负责研究各网站、网页、链接的形态，发现它们的特点和规律； 2. 设计各种策略和算法，提升spider的抓取效果； 3. 分析spider的技术缺陷，对spider做出合理地直聘调整或改进； 4. 负责spider系统的升级和维护；职位要求： 1. 本科以上学历，计算机相关专业者； 2. 2年以上Python语言编程，熟悉linux平台、shell编程； 3. 有分布式数据仓库/NoSQL项目经验； 4. 熟悉mysql/memcached/mboss直聘ongo/scarpy等开源框boss架； 5. 能够和其他研发、产品和测试、运维的同学高效沟通； 6. 搜索相关领域如网页来自BOSS直聘抓取、解析/信息挖掘/统计分析、逆向等工作经验、多语言研发经验优先。

技能解析

专有技能

熟悉数据库
信息采集
获取信息
系统架构
缓存技术
熟悉数据
抓包工具
性能优化
数据库性能
通信原理
数据采集
编码能力
网络通信

数据来自CSL职业科学研究室

技能解析

专有技能

数据仓库
高效沟通
语言编程
分布式数据
研发经验
开源框架
统计分析

数据来自CSL职业科学研究室

工作时间

上午09:30 - 下午06:30

双休、弹性工作

工作时间

上午10:00 - 下午07:00

双休、不加班

公司福利

生日福利
节日福利
免费工装
团建聚餐
零食下午茶
餐补
包吃
带薪年假
股票期权
年终奖
定期体检
补充医疗保险
五险一金
定期团建

公司福利

交通补助
生日福利
节日福利
团建聚餐
零食下午茶
餐补
带薪年假
股票期权
年终奖
定期体检
意外险
补充医疗保险
五险一金

职位&公司对比

爬虫工程师

爬虫工程师

爬虫工程师

爬虫工程师

职位详情

职位详情

技能解析

技能解析

工作时间

工作时间

公司福利

公司福利