Pro-Linux.de

Pro-Linux

Pro-Linux Diskussions- und Hilfeforum
Aktuelle Zeit: 19. Nov 2018 4:09

Alle Zeiten sind UTC+01:00




Ein neues Thema erstellen  Auf das Thema antworten  [ 6 Beiträge ] 
Autor Nachricht
BeitragVerfasst: 19. Mär 2009 18:54 
Offline
Benutzeravatar

Registriert: 06. Mai 2006 19:58
Beiträge: 252
Hallo,

ich habe viele Dateien im ODT-Format angelegt, die ich gern nach bestimmten Textmustern durchsuchen möchte. Bisher hatte ich noch keine andere Lösung und ich habe die wichtigsten Dateien nochmals im txt-Format gespeichert. Danach konnte ich mit folgendem Befehl suchen:
Code:
find -name '*.txt' -print -exec grep -i 'Muster' {} \;
Da ich mir nicht vorstellen konnte, dass das der einzig mögliche Weg sein soll, habe ich mal aus einer odt-Datei den Inhalt im xml-Format heraus geholt:
Code:
unzip Test.odt content.xml
In der xml-Datei fehlen die Zeilenumbrüche. Ich bin deshalb mit dem Durchsuchen mehrerer Dateien auch nicht so richtig weitergekommen, da zu viel Text einer Datei angezeigt wird. Möglicherweise gibt es eine einfache Lösung (vielleicht sogar in OpenOffice.org), die ich jetzt einfach übersehe.

Ich möchte mit meiner Arbeit noch nicht auf Latex, Lyx oder ähnliches umsteigen, da ich mich damit nicht so gut auskenne. Vielleicht ist auch ein Makro in OpenOffice.org Basic die Lösung?

Viele Grüße
Frank


Nach oben
   
 Betreff des Beitrags:
BeitragVerfasst: 20. Mär 2009 12:13 
Offline
Benutzeravatar

Registriert: 11. Feb 2006 19:10
Beiträge: 3569
Installiere "xmlstarlet". Dann
Code:
$ unzip -p Test.odt content.xml | xmlstarlet sel -N text="urn:oasis:names:tc:opendocument:xmlns:text:1.0" -T -t -m '//text:p' -v . -n
Manchmal heißt das Binary auch einfach nur "xml" statt "xmlstarlet", muss du gucken.

Siehe auch hier: http://usefreetools.blogspot.com/2008/0 ... ts-as.html

Janka

_________________
Ich vertonne Spam immer in /dev/dsp statt /dev/null.
Ich mag die Schreie.


Nach oben
   
 Betreff des Beitrags:
BeitragVerfasst: 20. Mär 2009 18:57 
Offline
Benutzeravatar

Registriert: 06. Mai 2006 19:58
Beiträge: 252
Hallo Janka,

vielen Dank. Das war genau das, was ich gesucht habe. Bei mir heißt das Binary xml. Die Manpage für xmlstarlet sieht bei mir etwas spärlich aus. Vielleicht hast du noch einen guten Link. Speziell interessiert mich die Bedeutung der folgenden Option:

-v .

Ich vermute, der Punkt bezieht sich auf //text:p

Ich habe gleich noch den kxmleditor installiert. Damit kann man leicht in xml-Dateien navigieren und der Textbefehl wird verständlich.

Viele Grüße
Frank


Nach oben
   
 Betreff des Beitrags:
BeitragVerfasst: 21. Mär 2009 14:40 
Als PDF oder Text (siehe Links im Dokument)
http://xmlstar.sourceforge.net/docs.php


Nach oben
   
 Betreff des Beitrags: kb
BeitragVerfasst: 23. Mär 2009 11:11 
Geht mit Kerry Beagle irgendwie einfacher, ist dann aber nicht mehr Unix-cool ... ;)


Nach oben
   
 Betreff des Beitrags: Re: kb
BeitragVerfasst: 23. Mär 2009 11:48 
Offline
Benutzeravatar

Registriert: 11. Feb 2006 19:10
Beiträge: 3569
Zitat:
Geht mit Kerry Beagle irgendwie einfacher, ist dann aber nicht mehr Unix-cool ... ;)
Und bringt dir auch nur was, wenn du "interaktiv" nach Begriffen suchen willst. Hat man eine Liste von Suchwörtern, müsste man Kerry auch wieder Skripten, was "einfacher" wieder relativiert.

Janka

_________________
Ich vertonne Spam immer in /dev/dsp statt /dev/null.
Ich mag die Schreie.


Nach oben
   
Beiträge der letzten Zeit anzeigen:  Sortiere nach  
Ein neues Thema erstellen  Auf das Thema antworten  [ 6 Beiträge ] 

Alle Zeiten sind UTC+01:00


Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 0 Gäste


Sie dürfen keine neuen Themen in diesem Forum erstellen.
Sie dürfen keine Antworten zu Themen in diesem Forum erstellen.
Sie dürfen Ihre Beiträge in diesem Forum nicht ändern.
Sie dürfen Ihre Beiträge in diesem Forum nicht löschen.
Sie dürfen keine Dateianhänge in diesem Forum erstellen.

Suche nach:
Gehe zu:  
cron
Powered by phpBB® Forum Software © phpBB Limited
Deutsche Übersetzung durch phpBB.de