Login


 
Newsletter
Werbung

Mi, 30. November 2011, 09:58

Software::Netzwerk

Freie Suchmaschine: Apache Lucene und Solr 3.5 veröffentlicht

Die Apache Software Foundation hat ihre Suchmaschine Lucene und die darauf aufbauende Suchplattform Solr in der Version 3.5 veröffentlicht.

Apache Software Foundation

Apache Lucene 3.5 benötigt nur ein Fünftel bis ein Drittel des Hauptspeichers, um einen Termindex beim Öffnen des Index-Readers zu laden. Der neue IndexSearcher.searchAfter kann Ergebnisse mit einem von Nutzer spezifizierten Bewertung (Scoring) zurückgeben. Die Lucene-Entwickler erweiterten ihre Suchmaschine zudem um einen SearcherManager, der IndexSearchers über (ACROSS) mehrere Suchvorgänge verwaltet. Der ebenfalls neu hinzugekommene SearcherLifetimeManager garantiert eine konsistente Darstellung des Index über (ACROSS) mehrere Anfragen. Der NGramPhraseQuery beschleunigt Suchanfragen, die einer n-gram-Analyse unterzogen werden, um 30 bis 50 Prozent. Weitere Verbesserungen werden durch eine neue reopen-API, überarbeitete Vektorhervorhebung und zusätzliche Prüfungen im IndexSearcher und IndexReader erzielt. Neben den Neuerungen befreiten die Entwickler Lucene von mehreren Fehlern.

Die auf Lucene basierende und ebenfalls aktualisierte Suchplattform Solr 3.5 unterstützt verteilte Ergebnis-Gruppierungen und den Hunspell-Stemmer TokenFilter, der Wörter in 99 Sprachen auf ihren Wortstamm zurechtstutzt. Das Contrib-Modul »Langid« kann die in Dokumenten verwendeten Sprachen erkennen und der hl.q-Parameter ermöglicht es, den Parameter q in der Hervorhebungsfunktionalität zu überschreiben. Auch in Solr wurden etliche Fehler behoben.

Lucene stellt nur die reinen Funktionalitäten einer Suchmaschine, unter anderem die Analyse und Indizierung von Texten, die Abfragesyntax und das auf Information Retrieval beruhende Scoring, bereit. Solr ist eine Serverkomponente, die beispielsweise Web-Anfragen entgegennimmt, einen Cache für Suchergebnisse, eine Administrationsschnittstelle und eine Funktionalität für alternative Suchbegriffe bietet. Lucene und Solr stehen unter der Apache License und wurden in Java implementiert. Für andere Sprachen existieren etliche Forks. Sowohl Lucene als auch Solr können von verschiedenen Spiegelservern heruntergeladen werden.

Werbung
Kommentare (Insgesamt: 0 || Kommentieren )
Pro-Linux
Pro-Linux @Facebook
Neue Nachrichten
Werbung