标签:Webmagic配置

JAVA

Webmagic 爬虫的配置、启动和终止

herman 7年前 (2017-04-12) 7412浏览 0评论

通过上一篇的小 demo,我们发现爬取网页内容都是通过实现 PageProcessor 来抓取的。在第一章也介绍到实 PageProcessor 是 Webmagic 4个重要组件之一。PageProcessor 的主要作用是:负责解析页面,抽取...