当前位置: 首页 > 资源下载  > 电子书 > 计算机

解析Python网络爬虫:核心技术、Scrapy框架、分布式爬虫

12/16/2018 9:53:18 PM 人评论

本书结合案例讲解各知识点,帮助读者掌握Python网络爬虫的核心技术。 网络爬虫是一种按照一定的规则,自动请求万维网网站并提取网络数据的程序或脚本,它可以代替人力进行信息采集,能够自动采集并高效地利用互联网中的数据,在市场的应用需求中占据着重要的位

解析Python网络爬虫:核心技术、Scrapy框架、分布式爬虫

解析Python网络爬虫:核心技术、Scrapy框架、分布式爬虫

编辑推荐

本书结合案例讲解各知识点,帮助读者掌握Python网络爬虫的核心技术。

内容简介

网络爬虫是一种按照一定的规则,自动请求万维网网站并提取网络数据的程序或脚本,它可以代替人力进行信息采集,能够自动采集并高效地利用互联网中的数据,在市场的应用需求中占据着重要的位置。

本书以Windows为主要平台,系统全面地讲解了Python网络爬虫的相关知识。主要内容包括:初识爬虫、爬虫的实现原理和技术、网页请求原理、爬取网页数据、数据解析、并发下载、图像识别与文字处理、存储爬虫数据、初识爬虫框架Scrapy、Scrapy终端与核心组件、自动爬取网页的爬虫 CrawSpider、Scrapy-Redis分布式爬虫。

本书适合作为高等院校计算机相关专业程序设计课程教材,也可作为Python网络爬虫的培训教材,以及广大编程开发者的爬虫入门级教材。

作者简介

黑马程序员:江苏传智播客教育科技股份有限公司(简称传智播客)是一家专门致力于高素质软件开发人才培养的高科技公司。传智播客致力于为企业优选一流的人才的培训理念,经过多年的教学探索及战略布局,已向着综合型职业教育集团发展。目前,传智播客旗下已涵盖传智播客IT教育培训、黑马程序员训练营及博学谷三大子品牌。“黑马程序员”是传智播客旗下高端IT教育品牌。

附件下载

  • 下载

    百度网盘下载

    下载: 所需积分:90

  • 积分获取方法:先给账户进行充值,然后进行积分兑换,积分兑换比例:1元可兑换10个积分.
    具体可参考帮助如何获取积分说明

相关资源

  • Fortran程序设计(第四版)

    本书介绍了Fortran语言基础知识,以及结构化程序设计思想,该设计思想使得大型Fortran程序的维护更易于实现。本书面向的读者是科学/工程类学生,意在对他们进行相应领域的实践训练。本书是一本理想的Fortran语言资料。 本书在讲述Fortran知识过程中,按适用于大型项目开

    4/13/2025 1:24:25 PM
  • 人机交互基础教程(第3版)

    Delphi是面向对象的可视化软件开发平台,它提供了大量VCL组件,具有强大的数据库开发和网络编程能力,极大地提高了应用系统的开发速度,是目前软件开发工具之一。  《人机交互基础教程(第3版)》以DelphiXE8为开发平台进行修订,增加基于Android应用程序设计和基于

    3/23/2025 11:44:42 PM
  • C++面向对象程序设计(第三版)/“十三五”高校计算机应用技术系列规划教材

    《C++面向对象程序设计(第三版)/“十三五”高校计算机应用技术系列规划教材》是为具有C语言基础的读者编写的,主要介绍C什面向对象程序设计的基本知识和编程方法,全面讲述了C++面向对象的基本特征。内容包括类、对象、继承、派生类、多态性、虚函数、运算符重载、

    2/23/2025 12:55:51 PM
  • 算法零基础一本通(Python版全彩印刷)_电子书PDF格式百度云网盘下载

    《算法零基础一本通(Python版 全彩印刷)》指导读者从零开始学习算法:从基础数据结构开始,逐步解说信息安全算法,最后也讲解了人工智能入门领域的KNN和K-means算法。  《算法零基础一本通(Python版 全彩印刷)》理论与实例并重,在讲解算法理论时,使用热门程序

    12/29/2024 9:07:06 PM