今天小众和Riku都提到了一个将摘要输出的供稿种子转换为全文输出供稿种子的信息。很多很好的blog,他们提供的供稿种子只是提供摘要输出。不订阅摘要型供稿种子是我的一个习惯,而这样也让我错过了这些好的blog,因此这个信息很容易就吸引了我的注意。
这不是一个trick,它是由一个网站——まるごとRSS,提供的一种服务。这个服务简捷而舒服,只要输入提供摘要输出供稿种子的地址,然后它就会生成一个相应的提供全文输出的供稿种子地址,这时你就可以享受全文输出的爽快了。 😛
这个服务说起来实现其实挺简单的,只要读取原供稿种子中的文章链接,然后使用curl等工具读取文章页面的代码,判断代码中文章的内容,最后封装为供稿种子即可。难点只是如何判断html代码中那些是文章的内容。
这个网站,我们要面临的麻烦一是功夫网,好的服务你总是会有这样的担心;二是稳定性,毕竟这个服务用curl等手段获取文章内容,不好听就是采集了。
现在最怕的就是服务的不稳定性了, 自从上次sendmerss说他们出故障,到现在也没有把故障修复过来.
这些服务一般都不会太稳定。小打小闹的,练习性质。 🙁
如果真的需要,还是可以自己弄一下嘛
虽然我也用阅读器,但是我只是把它当作一个看文章标题的工具,要是碰到喜欢的文章,我还是习惯到网站页面上看,所以摘要输出对我没什么影响 😆
😉 嗯,个人的习惯问题。
我用了一年,终于把google reader里面的rss搞到只剩20个上下了。
用rss订阅很容易信息焦虑,其实重要的内容总会从各种途径来到我们面前。而知识也在我们对它有需求的时候才那么重要。
所以我现在只是看亲朋好友的八卦…-_-‘
所以看到一个外国的家伙说他用twitter来替代了google reader 😆
不错 像cb之类网站 都输出摘要 我不订阅
其实我也很少打开Google阅读器
那用什么阅读器啊。
如果只是xpath分析一下目标页面的话应该还算不上采集啦
事实上说采集也不算太过分,因为他们不单只分析的,还要把内容截取下来,封装为feed。
跟采集站比较,他们是不展示内容的,只是提供转化的作用。