本书以Java 为开发语言,系统地介绍了网络爬虫的理论知识和基础工具,包括网络爬虫涉及的Java 基础知识、HTTP 协议基础与网络抓包、网页内容获取、网页内容解析和网络爬虫数据存储等。本书选取典型网站,采用案例讲解的方式介绍网络爬虫中涉及的问题,以增强读者的动手实践能力。同时,本书还介绍了3 种Java 网络爬虫开源框架,即Crawler4j、WebCollector 和WebMagic。 本书适用于Java 网络爬虫开发的初学者和进阶者;也可作为网络爬虫课程教学的参考书,供高等院校文本挖掘、自然语言处理、大数据商务分析等相关学科的本科生和研究生参考使用;也可供企业网络爬虫开发人员参考使用。
网络数据采集技术——Java网络爬虫实战 EPUB, PDF, MOBI, AZW3, TXT, FB2, DjVu, Kindle电子书免费下载。