Login
Newsletter
So, 13. Februar 2000, 23:13

Zerlegen einer Datei in Wörter

Was kann man tun, wenn man eine Datei in einzelne Wörter zerlegen will?

Etwas genauer formuliert, ist die Aufgabe: Alle Wörter einer Datei sollen als Liste untereinander geschrieben werden. Das ist gleichbedeutend damit, alle Leerzeichen in der Datei durch Zeilenumbrüche zu ersetzen. Mit einem Shell- oder Perlskript ist so etwas leicht zu erledigen. Doch auch für die Nicht-Programmierer gibt es eine einfache Möglichkeit:

tr ' ' '\n' < datei.txt

Die Ausgabe erscheint auf der Standardausgabe und kann in eine beliebige Datei umgeleitet werden oder als Eingabe für ein anderes Programm dienen. Beispielsweise könnte man die folgende Pipeline bilden, um alle Wörter in einer Datei mit ihrer Häufigkeit auszugeben, und zwar die häufigsten zuerst:

tr ' ' '\n' < datei.txt | sort | uniq -c | sort -nr

Kommentare (Insgesamt: 8 || Alle anzeigen )
Re[2]: Zerlegen einer Datei in Wörter (cray, So, 26. November 2000)
Re: Zerlegen einer Datei in Wörter (cld, Fr, 7. April 2000)
Re: Re: Zerlegen einer Datei in Wörter (Karsten, Fr, 18. Februar 2000)
Re: Re: Zerlegen einer Datei in Wörter (Jochen, Mo, 14. Februar 2000)
Re: Re: Zerlegen einer Datei in Wörter (Jochen, Mo, 14. Februar 2000)
Pro-Linux
Pro-Linux @Facebook
Neue Nachrichten