博客开始采集了
AndyYang|
阅读:1048
发表时间:2015-12-03 10:49:37
浪漫二十岁
摘要:近来没上班,闲来无事经常思考问题。一思考,就钻到死胡同里出不来。总感觉是被无形的谁耍的团团转,然后自己还没找到问题的关键,而找到出路后定是另外一番天地。另外心态倒是越来越浮躁,不能静下心来做点事情。另一方面也有在乎柴米油盐的问题,还好是孤家寡人,但心里的石头始终是放不下的。
近来没上班,闲来无事经常思考问题。一思考,就钻到死胡同里出不来。总感觉是被无形的谁耍的团团转,然后自己还没找到问题的关键,而找到出路后定是另外一番天地。另外心态倒是越来越浮躁,不能静下心来做点事情。另一方面也有在乎柴米油盐的问题,还好是孤家寡人,但心里的石头始终是放不下的。
总不至于一点事都不干吧?于是研究了下采集器:火车头和八爪鱼。
感觉八爪鱼的功能更强大一些?整体流程比较直观,整个流程下来就是一个流程图,另外在采集方面,动作也会更人性化些,有点类似firebug,点点确定一个区域块,傻瓜式的操作。火车头用的是一个早期的破解版,不知道新版的火车头会怎样?由于八爪鱼是免费版的,经常要我点击,特别是扣点数的时候,另外我没找到定时任务的地方,这样还是要自己点击就没太大意义了。免费版的局限性?
权衡再三,还是用了破解版的火车头,定时的抓取内容。抓取完只要上去生成静态的文章页就好。
博客自此走上了采集的人生,纪念一下。
采集专栏:http://www.webyang.net/Article/index/id/8
如需要破解版的火车头,请给我留言。
已有2条评论