Herold konvertiert HTML-Dateien in DocBook-Dateien. Es versucht die Struktur des HTML-Codes zu entdecken, indem es die Header-Elemente analysiert. Herold kann Tabellenelemente ausblenden und den Inhalt serialisieren. Ferner kann man bestimmte Elemente über XPath-Ausdrücke ausschließen.