Hinweis: Das Forum wird geschlossen! Neue Registrierungen sind nicht mehr möglich!

 Zurück zu Pro-Linux   Foren-Übersicht   FAQ     Suchen    Mitgliederliste
Suche in mehreren Dokumenten von OpenOffice.org (ODF)

 
Neuen Beitrag schreiben   Auf Beitrag antworten    Pro-Linux Foren-Übersicht -> Software
Vorheriges Thema anzeigen :: Nächstes Thema anzeigen  
Autor Nachricht
hastifranki



Anmeldungsdatum: 06.05.2006
Beiträge: 252

BeitragVerfasst am: 19. März 2009 18:54   Titel: Suche in mehreren Dokumenten von OpenOffice.org (ODF)

Hallo,

ich habe viele Dateien im ODT-Format angelegt, die ich gern nach bestimmten Textmustern durchsuchen möchte. Bisher hatte ich noch keine andere Lösung und ich habe die wichtigsten Dateien nochmals im txt-Format gespeichert. Danach konnte ich mit folgendem Befehl suchen:

Code:
find -name '*.txt' -print -exec grep -i 'Muster' {} \;


Da ich mir nicht vorstellen konnte, dass das der einzig mögliche Weg sein soll, habe ich mal aus einer odt-Datei den Inhalt im xml-Format heraus geholt:

Code:
unzip Test.odt content.xml


In der xml-Datei fehlen die Zeilenumbrüche. Ich bin deshalb mit dem Durchsuchen mehrerer Dateien auch nicht so richtig weitergekommen, da zu viel Text einer Datei angezeigt wird. Möglicherweise gibt es eine einfache Lösung (vielleicht sogar in OpenOffice.org), die ich jetzt einfach übersehe.

Ich möchte mit meiner Arbeit noch nicht auf Latex, Lyx oder ähnliches umsteigen, da ich mich damit nicht so gut auskenne. Vielleicht ist auch ein Makro in OpenOffice.org Basic die Lösung?

Viele Grüße
Frank
 
Benutzer-Profile anzeigen Private Nachricht senden

Janka



Anmeldungsdatum: 11.02.2006
Beiträge: 3569

BeitragVerfasst am: 20. März 2009 12:13   Titel:

Installiere "xmlstarlet". Dann
Code:

$ unzip -p Test.odt content.xml | xmlstarlet sel -N text="urn:oasis:names:tc:opendocument:xmlns:text:1.0" -T -t -m '//text:p' -v . -n

Manchmal heißt das Binary auch einfach nur "xml" statt "xmlstarlet", muss du gucken.

Siehe auch hier: http://usefreetools.blogspot.com/2008/06/antiodt-view-openoffice-documents-as.html

Janka
_________________
Ich vertonne Spam immer in /dev/dsp statt /dev/null.
Ich mag die Schreie.
 
Benutzer-Profile anzeigen Private Nachricht senden

hastifranki



Anmeldungsdatum: 06.05.2006
Beiträge: 252

BeitragVerfasst am: 20. März 2009 18:57   Titel:

Hallo Janka,

vielen Dank. Das war genau das, was ich gesucht habe. Bei mir heißt das Binary xml. Die Manpage für xmlstarlet sieht bei mir etwas spärlich aus. Vielleicht hast du noch einen guten Link. Speziell interessiert mich die Bedeutung der folgenden Option:

-v .

Ich vermute, der Punkt bezieht sich auf //text:p

Ich habe gleich noch den kxmleditor installiert. Damit kann man leicht in xml-Dateien navigieren und der Textbefehl wird verständlich.

Viele Grüße
Frank
 
Benutzer-Profile anzeigen Private Nachricht senden

PDA
Gast





BeitragVerfasst am: 21. März 2009 14:40   Titel:

Als PDF oder Text (siehe Links im Dokument)
http://xmlstar.sourceforge.net/docs.php
 

haha
Gast





BeitragVerfasst am: 23. März 2009 11:11   Titel: kb

Geht mit Kerry Beagle irgendwie einfacher, ist dann aber nicht mehr Unix-cool ... Wink
 

Janka



Anmeldungsdatum: 11.02.2006
Beiträge: 3569

BeitragVerfasst am: 23. März 2009 11:48   Titel: Re: kb

haha hat folgendes geschrieben::
Geht mit Kerry Beagle irgendwie einfacher, ist dann aber nicht mehr Unix-cool ... Wink

Und bringt dir auch nur was, wenn du "interaktiv" nach Begriffen suchen willst. Hat man eine Liste von Suchwörtern, müsste man Kerry auch wieder Skripten, was "einfacher" wieder relativiert.

Janka
_________________
Ich vertonne Spam immer in /dev/dsp statt /dev/null.
Ich mag die Schreie.
 
Benutzer-Profile anzeigen Private Nachricht senden

Beiträge vom vorherigen Thema anzeigen:   
     Pro-Linux Foren-Übersicht -> Software Alle Zeiten sind GMT + 1 Stunde
Seite 1 von 1

 
Gehen Sie zu:  

Powered by phpBB © phpBB Group
pro_linux Theme © 2004 by Mandaxy