Login
Newsletter
Di, 5. Juni 2007, 18:34

Interessante Webseite im Blick mit watch_web

Eine Menge interessanter Seiten im Netz kommt noch ohne RSS-Feed aus. Um immer auf dem neusten Stand zu sein, kann man entweder die Webseite häufig selbst besuchen oder sie von einem kleinen Helferprogramm besuchen und sich bei Änderungen informieren lassen.

Eines dieser kleinen Helferlein ist Watch_Web, ein kleines Python-Skript von Sebastian Breier. Es informiert nicht nur einen selbst per E-Mail, sondern bietet zusätzlich die Möglichkeit, bei Änderungen von Webseiten einen für jede URL individuellen Kreis von Interessenten mit einer Mail zu beglücken.

Das Programm ist schnell heruntergeladen und mit tar -xjvf Watch_Web.tar.bz2 entpackt. Im neu entstandenen Verzeichnis Watch_Web muss man als nächstes das Python-Skript anpassen. Dazu editiert man im Abschnitt #User settings die Zeilen

SOURCE_ADDRESS = "" # FROM address for mails
MAILSERVER = "" # SMTP server for mails
MAILUSER = "" # login for your SMTP (optional)
MAILPASSWORD = "" # password for your SMTP (optional

und speichert das Ganze.

Zur Bedienung des Programms:

pfad/watch_web.py ohne Parameter listet alle momentan beobachteten URLs, ihre Indizes und zugehörige Interessenten auf.

pfad/watch_web.py add url [mail1 mail2] ergänzt die Liste der zu beobachtenden Seiten um einen Eintrag und die Mailadressen der Interessenten, die bei Änderung informiert werden.

pfad/watch_web.py mv idx url ändert Seite mit Index idx zu url, ohne die Interessenten zu beeinflussen

pfad/watch_web.py rm idx entfernt die Seite mit Index idx und ihre Interessenten aus der Liste

pfad/watch_web.py subscribe idx [mail1 mail2] fügt der Seite mit Index idx die Interessenten mail1 und mail2 hinzu

pfad/watch_web.py unsubscribe idurl idmail Der Interessent mit dem Mailindex idmail wird zukünftig nicht mehr über Änderungen der Seite mit Index idurl informiert

pfad/watch_web.py update prüft, ob eine der zu beobachtenden Seiten aktualisiert wurde

Es bietet sich an, für den letzten Befehl einen Cron-Job einzurichten, so dass der Rechner regelmäßig selbst prüft, ob es Änderungen gibt. Die Liste der zu überwachenden Webseiten liegt in der Datei ~/.watch_web. Änderungen erkennt das Skript mit Hilfe von Prüfsummen, die es beim Besuch der Webseiten erstellt, vergleicht und ebenfalls in ~/.watch_web speichert.

Das Programm arbeitet nicht rekursiv, so dass jede Seite mit der genauen URL angegeben werden muss.

Pro-Linux
Pro-Linux @Facebook
Neue Nachrichten