网络爬虫jsoup抓取网页数据使用详解
herman 9年前 (2016-03-31) 6622浏览 0评论
Java程序在解析HTML文档时,我们常常使用jsoup去解析HTML网页内容。但在jsoup之前我们使用HTMLParser去解析(HTMLParser学习地址:http://www.xttblog.com/?p=322),但现在我已经不再使用...
herman 9年前 (2016-03-31) 6622浏览 0评论
Java程序在解析HTML文档时,我们常常使用jsoup去解析HTML网页内容。但在jsoup之前我们使用HTMLParser去解析(HTMLParser学习地址:http://www.xttblog.com/?p=322),但现在我已经不再使用...
herman 9年前 (2016-03-31) 4642浏览 0评论
HTML本质上是XML的子集,但是HTML的语法没有XML那么严格,所以不能用标准的DOM或SAX来解析HTML。这时HTMLParser诞生了。 HTMLParser是一个用来解析HTML文档的开放源码项目,它具有小巧、快速、使用简单的特点以...
herman 9年前 (2016-03-30) 3369浏览 0评论
在这个不差钱的世界,讲性能优化是件很“多余”的事情。我们老板经常说的一句话是,开宝马的会在乎油钱吗?一台设备不行,就上两台。我当场泪奔,为什么我的工资不翻倍,你在乎这点钱吗? 很多人说这样的技巧纯属多余,但是作为程序员我...
herman 9年前 (2016-03-30) 3930浏览 0评论
递归在我们的程序中存在普遍的使用。今天在csdn里面看到一个朋友写了一篇递归的文章http://blog.csdn.net/codyguo/article/details/51009768,我告诉他,这不叫文章,这叫草稿,或者说笔记。没见过就这样...
herman 9年前 (2016-03-28) 3688浏览 0评论
现在的程序员都被框架给毒害了。什么Spring,Struts2等框架的横空出世,让程序员更关注业务,而非架构。以至于我在面试中问道Struts2如何配置packge的,回答者都讲不清。这是一种常见现象,从项目一开始,框架都搭好了,很少再做改动。今...
herman 9年前 (2016-03-24) 4147浏览 0评论
在生活中我们到处都可以见到带有水印的文档。网上也到处可见的水印图片,如csdn,淘宝,百度上的图片都带有水印。 尤其是现在盗版非常严重的社会。你刚写的文章,几秒钟后就出现在其他网站上,然后就会出现,到底谁是原创问题。如何解决盗版问题,其他的方法...
herman 9年前 (2016-03-23) 3464浏览 0评论
在讲到性能调优方面,我想无外乎就是3个方面: 1.硬件调优(替换有问题的硬件) 2.对数据库配置调优 3.对SQL语句进行调优 第一种通常可以让中央处理器(CPU)或磁盘速度加倍,也可以让内存增大 4 到 8 倍。主要是让资源最大化的利用...
herman 9年前 (2016-03-22) 3870浏览 0评论
做后端的认为做前端的很牛,能设计出各类独特的界面。做前端的认为后端的很难,尤其是各种业务逻辑。其实我想说的是大家都不容易,程序员更不容易。 想要学习好CSS,我们就要系统化,模块化的学习每一个知识点。最近在论坛中遇到有人问position,我就...
herman 9年前 (2016-03-18) 6887浏览 0评论
这在以前,想要web实现上传图片时进行预览是很困难的。主要也是借助一些插件,flash等去实现。有的做法是在选择图片后,立刻上传,再将图片展现出来,做到预览效果;如果上传者不满意或者选错了,重新上传,则还需要删除原来的。看起来要做到图片预览是非常...
herman 9年前 (2016-03-17) 5816浏览 0评论
在做电信的项目,或者银行、第三方支付业务等高保密,需要设计到存储IP的业务中。为了节省空间和性能,大家通常把字符串char(15)存储IP地址(占用16个字节)改为使用unsigned int来存储。 unsigned int只需要4个字节。下...
herman 9年前 (2016-03-16) 20884浏览 0评论
手机访问支付宝网页版的人都知道。如果你的手机上安装有支付宝,那么在访问支付宝手机网页时就会自动打开支付宝app,否则在页面上会提示你进行下载app。 也许你会感觉这个功能很炫,这是如何实现的呢?在今天这个功能可能被大家用乱了,但是在当初支付宝使...
herman 9年前 (2016-03-15) 6554浏览 0评论
网站布局多样化是我们前端的拿手菜!瀑布流,九宫格,响应式等等布局方式已成为主流。最近看到UC浏览器的默认标签页使用的就是九宫格布局。就研究了下,在这里,我就分享一下代码,共同学习下!效果如下: 代码如下: <!DOCTY...
herman 9年前 (2016-03-15) 3716浏览 0评论
最近各大电商网站不断的推出各类秒杀活动,让人应接不暇,作为一个IT程序员我们关注的是,如果让你去设计一个秒杀系统,你会怎么做? 一. 秒杀活动带来的挑战: 对现有网站构成冲击 秒杀活动为一个网站营销的附加活动,这个活动具...
herman 9年前 (2016-03-14) 9133浏览 0评论
计算机科学有两类根本问题。一类是理论:算法,数据结构,复杂度,机器学习,模式识别,等等等。一类是系统:操作系统,网络系统,分布式系统,存储系统,游戏引擎等等。 理论走的是深度,是在追问在给定的计算能力约束下如何把一个问题解决得更快更好。而系统走的...
herman 9年前 (2016-03-11) 3826浏览 0评论
看了几篇zip压缩算法的帖子,讲的算是比较细致了。但是算法只是讲算法,没有最终的实例代码。 今天我就使用java自带的java.util.zip.*来实现zip的解压缩。 代码如下: public class ZipUtil { ...