Wenn ich OOo benutzte, dann deshalb, weil ich Formatierungen, Kapitelnumerierungen, Fußnoten, Referenzen Textmarken,... verwende. Plain Text schreib' ich sowiso gleich in Kate.
O3totxt habe ich nicht installiert: Existiert scheinbar noch nicht für Ubuntu ... und auf das OpenDocument-Format wird auf der Homepage nicht einmal eingegangen... :-(
Aber es funktioniert für eine Analyse ausreichend auch mit html2text:
unzip -p Beispieldokument.odt content.xml | html2text | diction -L de
... nicht ganz sauber, da - je nach Dokument - ein paar Formatierungsbrocken erhalten bleiben, aber das scheint ein reiner Schönheitsfehler zu sein, da diction arbeitet.
Von einer Uno-Version die diction einbindet, erwarte ich, dass ich nicht auf die Komandozeile zurückgreifen muss, was für inhaltliche Betrachtungen eines Textes per Hand (bzw. Auge) ja eher hinderlich ist...
Immerhin kann ich es so bei Bedarf auf der Komandozeil an .odt-Dateien testen. Schön! :-)
Danke für diesen interessanten Kurztipp, gibt immer wieder ein paar Konsolen-Programme, die man noch nicht gesehen hat und die durchaus mal nützlich sein könnten.
Salve! 1. Wie kann mer einen thesaurus, z.B. von openoffice per shell oder innerhalb von vim/mutt nutzen? 2. Wie kann man eigene Erweiterungen per shell vornehmen? g, rob
"To obtain a file to be used here, check out the wordlist FAQ at http://www.hyphenologist.co.uk ." Meine Frage war aber, wie man openoffice.org-thesaurus-de ohne OO.org per shell oder vim verwenden kann
Cherry, L.L.; Vesterman, W.: Writing Tools—The STYLE and DICTION programs, Computer Sci‐ ence Technical Report 91, Bell Laboratories, Murray Hill, N.J. (1981), republished as part of the 4.4BSD User’s Supplementary Documents by O’Reilly.
De Vries, Hugo: Reading Ease@WWW, http://www.shlrc.mq.edu.au/~hdevries/RE.html
Der Link funktioniert leider nicht mehr... Die Literatur dürfte weiterhelfen...
Zuerst habe ich einen meiner Texte durch Style gejagt und bekam das hübsche Lix-Ergebnis: school year 6. Ich schätzte meinen Text jedoch deutlich anspruchsvoller ein, aber um sicher zu gehen, gab es für Style nun einen Ausschnitt aus Thomas Manns Zauberg: school year 6. Gut, Thomas Mann kann anscheinend nichts, und da sich auch noch "Mein Kampf" auf der Platte befindet, war es das nächste Testobjekt: higher than school year 11.
Vielleicht lag es an einer ungünstigen Auswahl und Länge des Ausschnittes, weshalb ich nun das komplette Buch durch Style jagte: Thomas: school year 8 Adolf: Assertion failed: (n>0), function noteHit, file style.c, line 119. [1] 17145 abort style -L de b.txt
Fazit: Style ist amüsant, aber für nichts zu gebrauchen.
Von Daniel Naber am Mi, 25. Oktober 2006 um 22:14 #
Das nutze ich mal als gute Gelegenheit, um auf mein Programm LanguageTool hinzuweisen: www.danielnaber.de/languagetool/. Das ist ein erweiterbarer Textprüfer, für den man Regeln in Java oder XML schreiben kann. Es handelt sich noch um eine frühe Version, man bekommt derzeit noch viele Fehler angezeigt, die gar keine sind.
magischesProgramm - geheimParameter beispiel.odt | diction -L de
Ich glaub ich bin zu doof dafür es selbst zu programmieren. Kann mal bitte jemand von Euch..?
Und das Ergebnis bitte in diesem Thread stellen. Danke.
unzip -p beispiel.sxw content.xml | o3totxt | diction -L de
Keine Ahnung, ob o3read auch mit OpenDocument funktioniert.
Aber es funktioniert für eine Analyse ausreichend auch mit html2text:
unzip -p Beispieldokument.odt content.xml | html2text | diction -L de
... nicht ganz sauber, da - je nach Dokument - ein paar Formatierungsbrocken erhalten bleiben, aber das scheint ein reiner Schönheitsfehler zu sein, da diction arbeitet.
Von einer Uno-Version die diction einbindet, erwarte ich, dass ich nicht auf die Komandozeile zurückgreifen muss, was für inhaltliche Betrachtungen eines Textes per Hand (bzw. Auge) ja eher hinderlich ist...
Immerhin kann ich es so bei Bedarf auf der Komandozeil an .odt-Dateien testen. Schön! :-)
Danke für die Anregungen! - Gruß!
1. Wie kann mer einen thesaurus, z.B. von openoffice per shell oder innerhalb von vim/mutt nutzen?
2. Wie kann man eigene Erweiterungen per shell vornehmen?
g, rob
Meine Frage war aber, wie man openoffice.org-thesaurus-de ohne OO.org per shell oder vim verwenden kann
Cherry, L.L.; Vesterman, W.: Writing Tools—The STYLE and DICTION programs, Computer Sci‐
ence Technical Report 91, Bell Laboratories, Murray Hill, N.J. (1981), republished as
part of the 4.4BSD User’s Supplementary Documents by O’Reilly.
De Vries, Hugo: Reading Ease@WWW, http://www.shlrc.mq.edu.au/~hdevries/RE.html
Der Link funktioniert leider nicht mehr... Die Literatur dürfte weiterhelfen...
funktioniert, ist mir aber fuer heute nacht zu lang.
Vielleicht lag es an einer ungünstigen Auswahl und Länge des Ausschnittes, weshalb ich nun das komplette Buch durch Style jagte:
Thomas: school year 8
Adolf: Assertion failed: (n>0), function noteHit, file style.c, line 119.
[1] 17145 abort style -L de b.txt
Fazit: Style ist amüsant, aber für nichts zu gebrauchen.
Ja Adolf ist stylistisch schlecht.
www.danielnaber.de/languagetool/.
Das ist ein erweiterbarer Textprüfer, für den man Regeln in Java oder XML schreiben kann. Es handelt sich noch um eine frühe Version, man bekommt derzeit noch viele Fehler angezeigt, die gar keine sind.