Zerlegen einer Datei in Wörter
Was kann man tun, wenn man eine Datei in einzelne Wörter zerlegen will?
Etwas genauer formuliert, ist die Aufgabe: Alle Wörter einer Datei sollen als Liste untereinander geschrieben werden. Das ist gleichbedeutend damit, alle Leerzeichen in der Datei durch Zeilenumbrüche zu ersetzen. Mit einem Shell- oder Perlskript ist so etwas leicht zu erledigen. Doch auch für die Nicht-Programmierer gibt es eine einfache Möglichkeit:
tr ' ' '\n' < datei.txt
Die Ausgabe erscheint auf der Standardausgabe und kann in eine beliebige Datei umgeleitet werden oder als Eingabe für ein anderes Programm dienen. Beispielsweise könnte man die folgende Pipeline bilden, um alle Wörter in einer Datei mit ihrer Häufigkeit auszugeben, und zwar die häufigsten zuerst:
tr ' ' '\n' < datei.txt | sort | uniq -c | sort -nr