jsoup ist eine Java-Bibliothek zum Arbeiten mit HTML-Dokumenten, die nicht unbedingt korrekt sind. Sie kann HTML von einer URL, Datei oder einem String parsen. Sie kann Daten finden und extrahieren, wobei sie DOM oder CSS-Selektoren nutzt. Die HTML-Elemente, Attribute und Text können manipuliert werden. Sie kann von Benutzern eingegebene Inhalte von allem säubern, was nicht in einer weißen Liste steht. jsoup kann mit allen Varianten von HTML umgehen. (non)