Login
Newsletter
Werbung

Mi, 24. März 2004, 11:19

Software::Kommunikation

DSPAM mit »Train-on-Mature« Lernverfahren

DSPAM rüstet auf in der Spambekämpfung - mit der neu herausgegebenen Version 2.10.2.

DSPAM ist einerseits ein serverseitiger Spamfilter, der bereits auf dem Mailserver Spam identifiziert und als solchen kennzeichnet, sodaß er nicht erst heruntergeladen werden muss - andererseits auch eine Bibliothek zur Einbindung in Mailprogramme. So werden die unerwünschten Werbemails an beiden Seiten bekämpft. Dabei arbeitet es laut den Entwicklern bei manchen Benutzern mit einer Zuverlässigkeit von 99,92 bis 99,98 Prozent, wobei das größte System, auf dem DSPAM verwendet wird, 125.000 Postfächer umfasst.

Bei der Erfassung von Spam-Informationen setzt die Applikation dabei nicht auf Vermehrung, sondern auf Verbesserung des vorhandenen Wissensstandes. So wird versucht, mit steigender Komplexität und neuen Einfällen der Spammer das Programm dennoch schlank zu halten, statt für jede neue Art von Spam den Filter zu erweitern.

Das Projekt legt besonderes Augenmerk auf die Verbesserung von Daten bestehender Algorithmen, wie den Bayesischen Filter (wie auch Mozilla Mail und SpamAssassin ihn verwenden), die hohe Skalierbarkeit und die Benutzerfreundlichkeit. Dabei kann es mehrere Algorithmen verwenden und kombinieren, arbeitet mit einer Vielzahl von MTAs (wie Sendmail, Postfix, Qmail und Exim) zusammen, unterstützt mehrere Datenbanken zur Festhaltung von Spaminformation (darunter Berkeley DB3/4 und MySQL) und besitzt ein sehr zugängliches Lernverfahren, welches dem Benutzer ermöglicht, Spam an eine bestimmte Emailadresse weiterzuleiten. Es besitzt sogar einen Algorithmus, der absichtlich verunstaltete Wörter erkennt (wie "Via1gra"), die einen normalen Bayesischen Filter außer Gefecht setzen könnten.

Die besondere Neuerung dieser Version ist die Einführung des »Train-on-Mature« Lernverfahrens, das aus Spam nur Informationen erfasst, wenn diese noch nicht ausgereift ist. Der Reifegrad einer solchen Spamregel wird dadurch ermittelt, wieviele Treffer sie schon landen konnte. Train-on-Mature schafft somit einen Kompromiss zwischen Train-Everything, was anfällig für Daten ist, die sich zu schnell ändern, und Train-on-Error, was sich als schwierig erweist, da es nur im Falle eines Fehlers lernt.

Werbung
Pro-Linux
Pro-Linux @Facebook
Neue Nachrichten
Werbung