Hi,
es ist der Reguläre Ausdruck, der Dir (Euch?) Sorgen bereitet.
übersetzt sich in "Beliebig viele < (auch 0 < erlaubt), gefolgt von >". Das ist sicher nicht, was ihr wollt. Nehmt statt dessen besser
Das steht für "Genau ein <, gefolgt von beliebige vielen beliebigen Zeichem die aber kein > sein dürfen, gefolgt von genau einem >". Damit sollten alle Tags herausgeschmissen werden - ob mit sed oder awk ist dann einerlei.
Es könnte aber Fälle geben, wo ihr damit immer noch Probleme habt - JavaScript oder Inline-CSS im HTML könnten Euch einen Strich durch die Rechnung machen. Aber für eine erste Näherung reicht's.
Jochen