前段时间研究了一下自动化工具Huginn,在本地进行了部署,一直没能跑通。但监控网页变化的方式不止一种。今天就来介绍下Chrome插件Web Monitor,还有一个RSS制作的工具Feed43。

浏览器监控插件Distill Web Monitor

Distill Web Monitor是Chrome上一个监控网页变化的插件。可以监控全页面或部分元素上的内容变化,监控间隔从5秒到N天自由设定。在提醒方式上,除了本地的浏览器弹出窗口提醒及图标上的数字变化外,还提供了电子邮件,以及短信的提醒方式(部分需要高级版才可享用)。在项目详细设置的页面,甚至可以设定当价格低于某个值时提醒。

简单教程:

  • 打开需要监控的网页。
  • 点击浏览器工具栏上的 Distill's 水滴图标。
  • 根据您的需要选择 “部分页面” 或“监控整个页面”。选择部分页面时,把鼠标悬停在想要监控的网页区域,然后 “点击” 选择需要监控的部分页面。可以选择多个部分。
  • 点击保存,大功告成!
  • 点击 Distill 图标进入 监控列表,查看监控的网页列表。

示例用途:


监控京东上某个商品的价格和优惠信息。这里使用了正则表达式,目的是简化信息,只显示关键信息。规则如下:

  1. 正则:(¥)?\d{2,3}.\d{2}(?!元)|满\d+元{0,1}减\d+元{0,1}|满\d+件,总价打\d+(.\d+)?折
  2. 会员价CSS选择器:.itemInfo-wrap .p-price-plus .price
  3. 普通价CSS选择器:.itemInfo-wrap .p-price .price
  4. 优惠券CSS选择器:.quan-item
  5. 活动信息CSS选择器:.J-prom

监控过程要用Chrome浏览器,所以你必须用电脑。也可以使用云端监控(免费5个),这样打开Chrome的时候就能收到提醒了。

RSS定制

有些需要监控的内容,不是特别紧急,我们不希望它在工作的时候突然跳出来打扰。更建议使用RSS来监控。比如《权利的游戏》更新了之类的……但问题来了,大部分网站已经不再提供RSS订阅服务,这时候就需要我们自己来制作一个RSS。除了自己码一个监控,更好的方式当然就是利用 Fees43 的RSS生成服务。


Feed43在国内是没法顺利访问的,你需要懂一些科学方法。我个人很喜欢 RSS,从2007年开始用,中间有幸去了鲜果网工作,后来Google Reader停止服务,转到Feedly一直到现在。

具体的教程可以在网上搜索Feed43,也可以看 这篇教程。生成的RSS内容比较有限,如果需要得到全文内容,可以使用 FeedEx 服务进行全文输出。

你需要懂一些Html的知识,不过不用担心,仅仅几条规则而已。附一些我自己制作的一些规则:

  • QuestMobile行业研究报告

    Feed URL: https://feed43.com/7208524504271081.xml

    全文 URL:https://feedex.net/feed/feed43.com/7208524504271081.xml

  • 中国政府数据说

    Feed URL: https://feed43.com/3446885715685567.xml

    全文 URL:https://feedex.net/feed/feed43.com/3446885715685567.xml

  • 亿欧智库研究报告

    Feed URL: https://feed43.com/4865257434683335.xml

    全文 URL:直接输出PDF

  • 多看经管类图书

    Feed URL: https://feed43.com/4711718641114114.xml

    全文 URL:无需输出全文

  • 天善智能免费课

    Feed URL: https://feed43.com/5630740400287533.xml

    全文 URL:无需输出全文

  • 数据局报告

    Feed URL: https://feed43.com/5544317218176523.xml

    全文 URL:https://feedex.net/feed/feed43.com/5544317218176523.xml

  • 极光大数据

    Feed URL: https://feed43.com/2123614508207504.xml

    全文 URL:https://feedex.net/feed/feed43.com/2123614508207504.xml

  • 海贼王漫画

    Feed URL: https://feed43.com/8216742042416687.xml

    全文 URL:不需要输出全文

  • 艾瑞产业研究洞察

    Feed URL: https://feed43.com/6834308110480877.xml

    全文 URL:https://feedex.net/feed/feed43.com/6834308110480877.xml

  • TED腾讯视频

    Feed URL:https://feed43.com/7406454822715851.xml

    全文 URL:不需要输出全文

  • 天善学院 菜鸟学Python

    Feed URL: http://feed43.com/6764501242735674.xml

    全文 URL:https://feedex.net/feed/feed43.com/6764501242735674.xml

  • Owwly:

    Feed URL: http://feed43.com/8864310407767645.xml

  • 百度AI开放平台新产品

    Feed URL: http://feed43.com/7630075531541718.xml

  • 阿里云数据智能

    Feed URL: http://feed43.com/2867367418060262.xml

思考一个高阶玩法:可以用RSS监控API吗?