Hinweis: Das Forum wird geschlossen! Neue Registrierungen sind nicht mehr möglich!

 Zurück zu Pro-Linux   Foren-Übersicht   FAQ     Suchen    Mitgliederliste
html dateien mit awk bearbeiten, suche dringend hilfe!

 
Neuen Beitrag schreiben   Auf Beitrag antworten    Pro-Linux Foren-Übersicht -> Sonstiges
Vorheriges Thema anzeigen :: Nächstes Thema anzeigen  
Autor Nachricht
munch



Anmeldungsdatum: 06.06.2003
Beiträge: 1

BeitragVerfasst am: 07. Jun 2003 0:13   Titel: html dateien mit awk bearbeiten, suche dringend hilfe!

Nun guten Abend alle zusammen
Ich habe ein grosses Problem mit awk. Ich bin total neu auf Linux umgestiegen und hatte schon auf Windows ein Riesenproblem mit html dateien. Also ich habe Zehntausende von html Dokumenten und wollte die mit html2txt tools nur noch auf Text schrumpfen.
Es gibt ja viele Tools die html zu normalem Text machen, aber es bleibt trozdem ein riesen Chaos. Und für die Verarbeitung von Texten soll awk ja gut sein. Jetzt habe ich mir überlegt, das es viel zu kompliziert wäre, wenn man ja jeden einzelnen htmltag der gelöschen werden soll programmieren muss, darum wäre es doch am besten, wenn awk einfach die gesamte Datei löscht ausser gewisse Daten in gewünschten htmltags. Das daraus wirklich nur das kommt, was auch kommen soll. Mein grosses Problem ist einfach das ich nicht Programmieren kann und jetzt wollte ich euch fragen, ob ihr mir helfen könntet. Ich mache euch nun
noch ein Beispiel dazu:


<html>

<head>
<meta http-equiv="Content-Language" content="de">
<meta http-equiv="Content-Type" content="text/html; charset=windows-1252">
<title>Testdokument</title>
</head>

<body>
<hr>
<p> </p>

<p><font face="Arial">Dies ist ein Test</font></p>

</body>

</html>


Wenn ich beispielsweise nur den Text zwischen <font face="Arial"> und </font> will und alles andere gelöscht werden soll.
Könnt ihr mir helfen?


Vielen dank schon im voraus
 
Benutzer-Profile anzeigen Private Nachricht senden E-Mail senden

hjb
Pro-Linux


Anmeldungsdatum: 15.08.1999
Beiträge: 3236
Wohnort: Bruchsal

BeitragVerfasst am: 07. Jun 2003 13:07   Titel: Re: html dateien mit awk bearbeiten, suche dringend hilfe!

Hi!

awk ist obsolet außer vielleicht für kleinste Aufgaben. Nimm Perl. Ich kann dir hier jetzt aber keine Anleitung geben. Vielleicht hat jemand anderes ein passendes Skript oder die Zeit, eines zu machen...

Warum beläßt du es nicht bei HTML? Du mußt nur das <font face="alrial"> und das </font> löschen, dann ist es korrektes HTML...

Gruß,
hjb
_________________
Pro-Linux - warum durch Fenster steigen, wenn es eine Tür gibt?
 
Benutzer-Profile anzeigen Private Nachricht senden E-Mail senden Website dieses Benutzers besuchen MSN Messenger

Munch
Gast





BeitragVerfasst am: 07. Jun 2003 16:12   Titel: Re: html dateien mit awk bearbeiten, suche dringend hilfe!

So einfach ist es eben nicht. Es ist ein totales Chaos!
 

Scory
Gast





BeitragVerfasst am: 10. Jun 2003 23:22   Titel: Re: html dateien mit awk bearbeiten, suche dringend hilfe!

Nimm PHP4, da gibt es eine Funktion strip_tags() (siehe http://de3.php.net/manual/en/function.strip-tags.php), das bekommst Du auch als Anfänger schnell hin. Wird ein Miniminiprogramm.

MfG
Scory
 

Beiträge vom vorherigen Thema anzeigen:   
     Pro-Linux Foren-Übersicht -> Sonstiges Alle Zeiten sind GMT + 1 Stunde
Seite 1 von 1

 
Gehen Sie zu:  

Powered by phpBB © phpBB Group
pro_linux Theme © 2004 by Mandaxy