05
12 月

图片是网页中占用宽带大户,比JS、CSS相比大很多,而且后者重用率很高。设置合适的缓存时间后,JS和CSS能够直接从本地加载,而图片往往因页面而异。异步加载有效的减少了页面阻塞,也可以节约服务器资源。

通常的方案是不为图片标签设置正确的src地址,然后通过JS来赋予src正确的值,就实现了异步[……]

阅读全文

02
12 月

最近几年,内容网站开始流行给页面添加目录,方便访客浏览,其实维基百科很早就在使用。WordPress平台文章目录的生成方式有很多,省事就是直接使用插件,但几个经典插件久未更新,而且多在文章内展示,我基于露兜博客中的代码,添加最多两级的目录,放在侧边栏,会随着页面滚动保持跟随。

效果预览

本页预览[……]

阅读全文

02
11 月

在网络爬虫中,HTML网页文件解析是重要的一环,原来实现数据的清洗和提取,Jsoup作为一款解析器被广泛的使用,但我在使用时总遇到一些莫名其妙的问题,就改用正则表达式来解析。

解析过程中链接地址提取必不可少,但格式多样性就会有许多问题,主要集中在a标签内引号的使用及链接地址相对和绝对的写法上。[……]

阅读全文