Interessante Webseite im Blick mit watch_web
Eine Menge interessanter Seiten im Netz kommt noch ohne RSS-Feed aus. Um immer auf dem neusten Stand zu sein, kann man entweder die Webseite häufig selbst besuchen oder sie von einem kleinen Helferprogramm besuchen und sich bei Änderungen informieren lassen.
Eines dieser kleinen Helferlein ist Watch_Web, ein kleines Python-Skript von Sebastian Breier. Es informiert nicht nur einen selbst per E-Mail, sondern bietet zusätzlich die Möglichkeit, bei Änderungen von Webseiten einen für jede URL individuellen Kreis von Interessenten mit einer Mail zu beglücken.
Das Programm ist schnell heruntergeladen und mit tar -xjvf Watch_Web.tar.bz2
entpackt. Im neu entstandenen Verzeichnis Watch_Web muss man als nächstes das Python-Skript anpassen. Dazu editiert man im Abschnitt #User settings
die Zeilen
SOURCE_ADDRESS = "" # FROM address for mails MAILSERVER = "" # SMTP server for mails MAILUSER = "" # login for your SMTP (optional) MAILPASSWORD = "" # password for your SMTP (optional
und speichert das Ganze.
Zur Bedienung des Programms:
pfad/watch_web.py
ohne Parameter listet alle momentan beobachteten URLs, ihre Indizes und zugehörige Interessenten auf.
pfad/watch_web.py add url [mail1 mail2]
ergänzt die Liste der zu beobachtenden Seiten um einen Eintrag und die Mailadressen der Interessenten, die bei Änderung informiert werden.
pfad/watch_web.py mv idx url
ändert Seite mit Index idx zu url, ohne die Interessenten zu beeinflussen
pfad/watch_web.py rm idx
entfernt die Seite mit Index idx und ihre Interessenten aus der Liste
pfad/watch_web.py subscribe idx [mail1 mail2]
fügt der Seite mit Index idx die Interessenten mail1 und mail2 hinzu
pfad/watch_web.py unsubscribe idurl idmail
Der Interessent mit dem Mailindex idmail wird zukünftig nicht mehr über Änderungen der Seite mit Index idurl informiert
pfad/watch_web.py update
prüft, ob eine der zu beobachtenden Seiten aktualisiert wurde
Es bietet sich an, für den letzten Befehl einen Cron-Job einzurichten, so dass der Rechner regelmäßig selbst prüft, ob es Änderungen gibt. Die Liste der zu überwachenden Webseiten liegt in der Datei ~/.watch_web. Änderungen erkennt das Skript mit Hilfe von Prüfsummen, die es beim Besuch der Webseiten erstellt, vergleicht und ebenfalls in ~/.watch_web speichert.
Das Programm arbeitet nicht rekursiv, so dass jede Seite mit der genauen URL angegeben werden muss.