职位&公司对比
职位详情
- 北京
- 不限
- 不限
- Python
岗位职责: • 参与云合大数据分析平台的开发 • 网页爬虫构架设计与核心技术开发 BOSS直聘• 平台管理和运维 技能要求: • 算法和数据结构基础 • 至少熟悉Python、Java、C++、Perl等语言中的一种 • 网页爬虫开发经验 • 分布式系统经验 加分项:直聘 • 大数据平台相关经验,如Spar来自BOSS直聘k,Hadoo来自BOSS直聘p,Kafka、HBase等 • 数据可视化、数据建模、数据挖掘等经验
职位详情
- 北京
- 1-3年
- 本科
- 爬虫工程师
岗位职责: 1、数据采集:负责使用Python及相关boss工具进行网络数据的采集工作,确保数据的完整性和准确性。 2、数据清洗:对采集的数据进行清洗,去除无来自BOSS直聘效、错误和重复的数据,提高数据质量。 3、数据处理:对清洗后的数据进行加工处理,包括数据转换、聚合等,以满足业务需求。 4、数据模型构建:根据业务需求,构建合适的数据模型,为数据分析和应用提供支持。 5、技术优化:持续优化爬虫程序的性能,提高数据采集效率和稳定性。 任职要直聘求: 1、熟练掌握Python编程语言,具有良好的编程习惯和代码管理能力。 2、熟练使用linux系统及shell脚本语言。 3、熟练使用requests库进行HTTP请求,处理网络请求和响应。 4、熟练使用Scrapy等相关爬虫框架,熟悉多线程数据采集。 5、掌握Selenium自动化测试工具,用于处理JavaScript渲染的页面。 6、熟练使用re、bs4、XPath等技术,从结构化或非结构化的数据中进行数据提取。 7、熟练使用Mysql、MongoDB、Redis等关BOSS直聘系型非关系型数据库。 8、熟悉前端相关技术,能够解析和处理HTML文档,能够处理动态加载的网页内容。 9、熟悉常见的反爬机制,如IP限制、验证码、混淆加密等,有逆向相关经验。 学历与经验要求: 学历:本科及以上学历,计算机相关专业。 工作经验:1-3年。
技能解析
- 算法和数据结构
- 结构基础
- 大数据分析
- 技术开发
- 开发经验
- 数据建模
- 分布式系统
- 数据结构
- 数据可视化
- 数据挖掘
- 数据分析
数据来自CSL职业科学研究室
技能解析
- 脚本语言
- 数据质量
- 编程语言
- HTML
- 提供支持
- 代码管理
- 自动化测试工具
- 数据清洗
- 管理能力
- 数据模型
- 测试工具
- 数据处理
- 熟悉多线程
- 编程习惯
- 关系型数据库
- 数据采集
- 数据分析
数据来自CSL职业科学研究室
工作时间
工作时间
公司福利
- 五险一金
- 年终奖
- 带薪年假
- 员工旅游
- 餐补
公司福利
- 五险一金
- 节日福利
- 零食下午茶