Login
Newsletter
Werbung

Do, 8. März 2012, 15:00

Dokumentenmanagement mit LetoDMS, Teil 2

Im zweiten Teil der Artikelserie zu LetoDMS geht es um das Einrichten der Volltextsuche.

Dies ist der zweite Teil des Workshops LetoDMS. Im ersten Teil ging es um die grundlegende Einrichtung. In diesem Teil ist die Einrichtung der Volltextsuche an der Reihe. Alle Artikel dieses Workshops finden Sie in der Übersicht.

Einrichten der Volltextsuche

Ein DMS ohne Volltextsuche ist kein DMS. Deshalb verfügt auch LetoDMS seit der Version 3.2.0 über eine solche Suche, die auf den Lucene-Klassen des Zend-Frameworks beruht. Sie werden vermutlich bei der Installation von LetoDMS schon auf Einträge für die Konfiguration der Volltextsuche gestoßen sein, jetzt geht es daran, diese korrekt zu setzen.

Zunächst aber gilt es, das Zend-Framework und das PEAR-Paket LetoDMS_Lucene zu installieren. Zend-Framework wird vermutlich durch Ihre Linux-Distribution geliefert, kann aber alternativ auch von framework.zend.com heruntergeladen werden. LetoDMS_Lucene finden Sie im Download-Verzeichnis von LetoDMS. Alle Anpassungen in der LetoDMS-Konfiguration können über die Einstellungen-Seite erfolgen. Damit es funktioniert, müssen zunächst beide Pakete so installiert werden, dass sie über den PHP-Include-Path gefunden werden.

LetoDMS_Lucene können Sie alternativ auch parallel zu LetoDMS_Core auspacken und dann in den Einstellungen den Pfad unter Lucene LetoDMS Directory entsprechend setzen. Wichtig ist noch das Verzeichnis lucene unterhalb des Content-Verzeichnisses und die Angabe des Pfads in den Einstellungen unter Directory for full text index. Hier wird später der Volltext-Index abgelegt. Stellen Sie sicher, dass das Verzeichnis vom User des Webservers geschrieben werden kann. Als Letztes noch die Volltextsuche in den Einstellungen einschalten, und in der Bedienoberfläche sollte eine Checkbox hinter dem Suchfeld in der Kopfzeile erscheinen.

Verwaltung

Suchformular in LetoDMS

Uwe Steinmann

Suchformular in LetoDMS

Ein Klick auf Suchen (ohne Eingabe eines Suchtextes) zeigt ein zweigeteiltes Suchformular. Links die schon bekannte Datenbanksuche und rechts die neue Volltextsuche (siehe Abb.). Jeder Versuch, etwas zu suchen, wird jedoch zunächst noch scheitern, weil zuvor der Index angelegt werden muss.

Gehen Sie dafür in die Admin-Tools und Klicken Sie auf Create Fulltext Index. Je nach Anzahl und Größe der Dokumente kann dies einige Zeit in Anspruch nehmen. Das Ergebnis ist eine eingerückte Liste mit allen Dokumenten, die indiziert wurden, und ein Index auf der Festplatte. Zur Kontrolle bietet sich jetzt ein Klick auf Fulltext Index Info auf der Seite mit den Einstellungen an. Das Ergebnis ist eine Liste aller indizierten Wörter und wo sie auftreten, denn es werden nicht nur die Inhalte, sondern auch die Metadaten der Dokumente indiziert. Die Einträge in der Liste, die mit title: beginnen, sind beispielsweise Wörter auѕ dem Titel eines Dokuments.

Wenn Sie hier keine Einträge finden, die mit content: beginnen (dies sind indizierte Wörter aus dem Inhalt), dann befindet sich entweder kein indizierbares Dokument im DMS oder es fehlt noch Software, die den Inhalt der Dokumente in eine Textdatei konvertiert. LetoDMS kann in der Version 3.3.0 bisher nur die Formate application/pdf, application/msword, application/vnd.ms-excel, audio/mp3, audio/mpeg und text/plain indizieren. Dafür benötigen Sie die zusätzliche Software pdftotext, catdoc, ssconvert und id3. In der Version 3.4.0 wird man weitere Formate und die passende Software zur Indizierung in der Konfiguration ablegen können.

Werden neue Dokumente eingestellt, dann erscheinen diese nicht sofort im Fulltext-Index. Dafür ist es notwendig, über den Verweis Update Fulltext Index auf der Einstellungen-Seite den Index zu aktualisieren. Den Index nicht mit jedem Upload eines neuen Dokuments zu aktualisieren, liegt vor allem darin begründet, dass dies mitunter sehr lange dauern und den Web-Server erheblich belasten kann, insbesondere wenn mehrere Dokumente gleichzeitig oder sehr große Dokumente hochgeladen werden. Die Aktualisierung sollte daher regelmäßig vom Administrator, ggf. über einen Cronjob, durchgeführt werden. Dabei werden immer nur die Dokumente berücksichtigt, die sich seit der letzten Aktualisierung geändert haben.

Die Suche selbst über das bereits erwähnte zweite Suchformular ist eher einfach. Ein Feld für den zu suchenden Text sowie zwei Felder (Kategorie und Besitzer), um das Suchergebnis einzuschränken, sorgen für Übersichtlichkeit. In zukünftigen Entwicklungen ist eine Erweiterung um weitere Suchkriterien nicht ausgeschlossen. Auch die Verschmelzung von Datenbank- und Volltextsuche ist denkbar.

Bei Fragen

Bleibt nur noch zu erwähnen, dass man zur Volltextsuche wie auch zu allen anderen Fragen zu LetoDMS im Forum von LetoDMS (erreichbar über die Homepage) oder unter www.letodms.de Hilfe bekommen kann.

  • Das Werk darf vervielfältigt, verbreitet und öffentlich zugänglich gemacht werden, Abwandlungen und Bearbeitungen des Werkes müssen unter den gleichen Bedingungen weitergegeben werden. Der Name des Autors/Rechteinhabers muss in der von ihm festgelegten Weise genannt werden.

    - Weitere Informationen
Kommentare (Insgesamt: 6 || Alle anzeigen )
Re: Screenshot (hjb, Fr, 9. März 2012)
Screenshot (JoeXX, Do, 8. März 2012)
Re[2]: Teil 1 (gunni, Do, 8. März 2012)
Re: Teil 1 (hjb, Do, 8. März 2012)
Re: Teil 1 (seraphyn, Do, 8. März 2012)
Pro-Linux
Pro-Linux @Facebook
Neue Nachrichten
Werbung