2 个回答
-
| 2017-10-09 07:31:57 广告
推荐如下的java开源爬虫或抓取框架
1.webmagic
【猪猪-后端】WebMagic框架搭建的爬虫,根据自定义规则,直接抓取,使用灵活,Demo部署即可查看。
官站:WebMagic
2.jsoup
java网络爬虫jsoup和commons-httpclient使用入门教程实例源码
搜索"jsoup"的分享列表
官站:jsoup Java HTML Parser, with best of DOM, CSS, and jquery
3.apache httpclient
java爬虫实现之httpClient4.2.1 连接池管理客户端请求 抓取页面简单示例
搜索"httpclient"的分享列表
HttpClient - HttpClient Home
4.如果觉得框架用起来复杂,其实完全可以通过java.net.HttpURLConnection来实现。
java通过java.net.HttpURLConnection类抓取网页源码工具类分享
搜索"HttpURLConnection"的分享列表
参考下爬虫相关的源码demo吧:
搜索"爬虫"的分享列表
搜索"抓取"的分享列表本问答由Night Silent提供
-
| 2017-10-09 07:24:45 广告
爬不爬的都无所谓了,你需要的只是一个好用的html解析库而已。个人推荐jsoup。本问答由Night Silent提供
更多
- 盛付通POS机刷卡没有到账怎么办?
- 13
- 3
- 开店宝POS机刷卡不到账怎么办?
- 7
- 3
- 盛店宝POS机刷卡没有到账怎么办?
- 19
- 3
- 开店宝pos机24小时热线电话是什么?
- 95
- 3
- 乐刷POS机刷卡没有到账怎么办?
- 67
- 3
- 速刷pos机400全国客服电话是什么?
- 2
- 3
- 安易付POS机全国人工客服400电话是多少?
- 32
- 3
- 汇付天下pos机400售后电话是什么?
- 1
- 3
- 盛刷pos机全国售后客服热线是多少?
- 82
- 3
- 开店宝pos机24小时热线电话是什么?
- 68
- 3