最新发布 第110页

JAVA

Webmagic(爬虫)抓取新浪博客案例

herman 8年前 (2017-04-14) 4616浏览 1评论

Webmagic框架更偏重实际的内容抓取。今天为大家分享Webmagic 爬虫框架抓取新浪博客的案例。 我们以作者的新浪博客http://blog.sina.com.cn/flashsword20作为例子。在这个例子里,我们要从最终的博客文...

JAVA

WebMagic 爬虫框架 注解用法

herman 8年前 (2017-04-13) 6129浏览 0评论

自从java注解出来之后,就无框架不注解。同样的 WebMagic 爬虫框架也支持注解的方式实现网页的抓取,今天为大家分享一下 WebMagic 爬虫的注解教程。 @TargetUrl和@HelpUrl HelpUrl/Ta...

JAVA

Webmagic处理POST、PUT、PATCH等请求

herman 8年前 (2017-04-13) 6376浏览 0评论

了解 RESTful 的都知道,POST不是幂等操作,所以理论上每次请求的结果都未必一样,所以原则上是没有办法做“去重”操作的。其次,除了GET请求,其他Method都没有办法自动发现,一般都是手工构建出来的,使用者更应该...

JAVA

Webmagic 爬虫监控和配置代理

herman 8年前 (2017-04-13) 9590浏览 1评论

现在的服务基本上都离不开监控。Webmagic 爬虫框架自带了监控功能,本文将带领大家使用 Webmagic 爬虫的监控功能。 Webmagic 爬虫的监控是0.5.0新增的功能。利用这个功能,可以查看爬虫的执行情况—...

JAVA

WebMagic Selectable抽取元素

herman 8年前 (2017-04-13) 7055浏览 0评论

昨天用的 WebMagic 最新版本,还存在一些问题。导致控制台报错,报错内容为找不到jsoup类文件。详情大家可以到https://github.com/code4craft/webmagic/issues/533查看。 今天我...

JAVA

WebMagic Xsoup 和 自定义Pipeline

herman 8年前 (2017-04-12) 6608浏览 0评论

WebMagic的抽取主要用到了Jsoup和官方自带的工具Xsoup。 Jsoup是一个简单的HTML解析器,同时它支持使用CSS选择器的方式查找元素。关于Jsoup的学习文章,大家可以到这里进行学习!https://github.com/...

JAVA

Webmagic 爬虫的配置、启动和终止

herman 8年前 (2017-04-12) 8150浏览 0评论

通过上一篇的小 demo,我们发现爬取网页内容都是通过实现 PageProcessor 来抓取的。在第一章也介绍到实 PageProcessor 是 Webmagic 4个重要组件之一。PageProcessor 的主要作用是:负责解析页面,抽取...

JAVA

WebMagic 入门

herman 8年前 (2017-04-11) 4248浏览 0评论

这是接着上一章 WebMagic 简介,我们来搭建第一个 WebMagic 爬虫项目。 WebMagic 主要包含两个jar包:webmagic-core-{version}.jar和webmagic-extension...

JAVA

WebMagic 简介

herman 8年前 (2017-04-11) 5686浏览 0评论

WebMagic 是一款简单灵活的爬虫框架。目前百度百科上还没有相关的词条,网上使用的人比较多。和 jsoup 相比它更小巧和简单。 本文主要介绍 WebMagic,后面会慢慢的深入,并结合一些实例来学习。如果时间充足我会录制一些...

HTML5

jQuery 实现蜂窝导航菜单

herman 8年前 (2017-04-11) 3139浏览 0评论

今天闲来无事就使用 jQuery 制作了一款导航产品,给大家分享一下。 jQuery蜂巢状布局导航标签代码是一款六边形蜂窝效果的CSS布局,适合做导航或者关键词展示使用。也可以做网站上的标签云。 效果图 实现原理 ...

NDIS

c++ 多态

herman 8年前 (2017-04-10) 3699浏览 0评论

网上关于C++的文章没有 java 的多,这和 java 大多数框架都开源的关系密切相关。今天为大家分享一篇C++ 面向对象 多态的文章! 什么是多态 学过java的人,我想这对他一定不陌生。 多态:字面意思就是多种形态。在面向...

HTML5

HTML5 Canvas手写字识别

herman 8年前 (2017-04-10) 9284浏览 0评论

今天又网友在论坛里问到关于 HTML5 手写字识别功能。这个功能看似有点难度,单独借助HTML5是无法实现的。我这里借助去年百度开发者大赛上的作品来实现它。 Canvas 绘图 我们首先要使用 Canvas 来实现绘图功能。代码如下:...

NDIS

C++实现视频监控分屏显示

nui111 8年前 (2017-04-08) 7071浏览 0评论

最近在做关于一个视频监控的项目涉及到分屏显示功能。下载了几个网上的例子看下都不是太符合要求,因此需要自己来实现。界面是使用MFC编写,摄像头使用directX库收集视频。剩下要做的就是把视频传送到监控端,使用的tcp协议。 运行效果 ...

HTML5

使用百度开源的player插件制作HTML5音乐播放器

herman 8年前 (2017-04-07) 8063浏览 0评论

近年来百度开源的项目也有很多,但是大多都没有阿里巴巴的开源框架使用的广泛。今天为大家分享一款基于百度开源的player插件制作HTML5音乐播放器。 HTML5音乐播放器 我们先看看运行效果: 这里的音乐引用的上一篇音乐...

业余杂谈

音乐网站接口大全

herman 8年前 (2017-04-07) 9219浏览 1评论

今天看到百度开源了一款HTML5音乐播放器插件,就用它做了一个播放器,用到了音乐网站的api接口。我这里分享一下,以备以后使用! 酷狗音乐接口 VIP接口:http://trackercdn.kugou.com/i/?cmd=4&am...