职位&公司对比

招聘中

爬虫工程师

-K
  • 计算机软件
职位关闭

爬虫工程师

-K·薪
  • 学术/科研
  • 不需要融资

职位详情

  • 北京
  • 1-3年
  • 大专
  • 数据抓取
  • 网络爬虫
  • 数据采集

采集软件的编写,采集清洗kanzhun,整理,储存。也BOSS直聘形式合作。

职位详情

  • 北京
  • 1-3年
  • 本科
  • 爬虫工程师

岗位职责: 1、数据采集:负责使用Python及相关工具kanzhun进行网络数据的采集工作,确保数据的完整性和准确性。 2、数据清洗:对采集的数据进行清洗,去除无效、错误和重复的数据,提高数据质量。 3、数据处理:对清洗后的数据进行加工处理,包括数据转换、聚合等,以满足业务需求。 4、数据模型构建:根据业务需求,构建合适的数据模型,为数据分析和应用提供支持。 5、技术优化:持续优化爬虫程序的性能,提高数据采集效率和稳定性。 任职要求: 1、熟练掌握Python编程语kanzhun言,具有良好的编程习惯和代码管理能力。 2、熟练使用linux系统及shell脚本语言。 3、熟练使用requests库进行HTTP请求,处理网络请求响应。 4、熟练使用Scrapy等相关爬虫框架,熟悉多线程数据采集。 5、掌握Selenium自动化测试工具,用于处理JavaScript渲染的页面。 6、熟练使用re、bs4直聘、XPath等技术,从结构化或非结构化的数据中进行数据提取。 7、熟练使用Mysql、MongoDB、Redis等关系型非关系型数据库。 8、熟悉前端相关技术,能够解析和处理kanzhunHTML文档,能够处理动态加载的网页内容。 9、熟悉常见的反爬机制,如IP限制、验证码、混淆加密等,有逆向相关经验。 学历与经验要求: 学历:本科及以上学历,计算机相关专业。 工作经验:1-3年。

技能解析

    暂无识别出相关技能要求

    技能解析

    专有技能
    • 脚本语言
    • 数据质量
    • 编程语言
    • HTML
    • 提供支持
    • 代码管理
    • 自动化测试工具
    • 数据清洗
    • 数据分析
    • 管理能力
    • 数据模型
    • 测试工具
    • 数据处理
    • 熟悉多线程
    • 编程习惯
    • 关系型数据库
    • 数据采集

      数据来自CSL职业科学研究室

      工作时间

      上午9:00   -   下午6:00

      公司福利

      • 五险一金
      • 节日福利
      • 零食下午茶
      更新于 2025-03-23