Lucene
aus Wikipedia, der freien Enzyklopädie
Dieser Artikel oder Abschnitt bedarf einer Überarbeitung. Näheres ist auf der Diskussionsseite angegeben. Hilf bitte mit, ihn zu verbessern, und entferne anschließend diese Markierung. |
Lucene ist eine Open-Source-Java-Bibliothek zum Erzeugen und Durchsuchen von Indizes.
Sie ist Teil des Apache Software Foundation-Projekts und wird federführend von Doug Cutting entwickelt.
Mit Hilfe dieser plattformunabhängigen Bibliothek lassen sich in kurzer Zeit Volltextsuchen für beliebige Inhalte erzeugen.
Die Bibliothek setzt sich aus zwei Hauptbestandteilen zusammen:
- Eine Komponente erzeugt den Index, wobei diesem beliebige, aber definierte Dokumente hinzugefügt werden.
- Eine Query Engine durchsucht diesen Index.
Neben diesen grundlegenden Eigenschaften verfügt Lucene über eine reichhaltige Auswahl zusätzlicher Funktionen und Tools, welche durch die Open-Source-Community aktiv und umfangreich weiterentwickelt werden.
Durch die hohe Performanz und Skalierbarkeit kann Lucene für beliebige Projektgrößen und Anforderungen eingesetzt werden.
Inhaltsverzeichnis |
[Bearbeiten] Projekte, die Lucene einsetzen
- Die Entwicklungsumgebung Eclipse verwendet Lucene bei der Suche durch die Hilfefunktion, die mehrere Tausend Seiten Text beinhaltet.
- CoreMedia, ein Hersteller von Standard-Software für Content-Management-Systeme (CMS) und Digital Rights Management (DRM), liefert Lucene bis zur Version 4.2 von CoreMedia CMS als Referenzlösung zur Suche mit. Damit ist Lucene derzeit ein zentraler Bestandteil des Government Site Builders, der durch Beschluss der Initiative Bund Online 2005 sukzessive für alle wichtigen Ministerien des Bundes eingesetzt wird.
- Der Deutsche Bundesrat verwendet CoreMedia mit Lucene.
- Recht für Deutschland. Ein ziemlich komplettes Archiv der deutschen Rechtsprechung mit mehr als eine Million Seiten.
- Eine ausführlichere Liste von Lucene-Nutzern im Lucene-Wiki
[Bearbeiten] Software, die Lucene einsetzt
- Beagle benutzt eine Übersetzung von Lucene nach C#, welche DotLucene genannt wird, als Indexer.
- Nutch ist eine vollständige Suchmaschine, welche Lucene verwendet.
- Red-Piranha ist eine weitere auf Lucene basierende Suchmaschine. Sie ist sofort einsetzbar und über eine grafische Benutzeroberfläche, per Kommandozeile oder als Tomcat-Web-Applikation verfügbar. Zudem besitzt sie die Fähigkeit zu "lernen", wonach der Benutzer sucht.
- MediaWiki für die Volltextsuche
- regain gibt es in zwei Versionen: die Desktop-Suche und die Server-Suche.
- GLScube bzw. GLS³, ein semantisches Dateisystem, nutzt eine C++-Konversion von Lucene für die Indizierung.
- WebGate Anywhere ist ein Content-Management-System der Firma Innovationgate, das Lucene als Indexer benutzt.
[Bearbeiten] Übersetzungen in andere Programmiersprachen
Lucene wurde und wird in zahlreiche andere Programmiersprachen übersetzt:
- CLucene – C++
- Zend_Search_Lucene – PHP
- NLucene – .NET
- DotLucene – .NET
- pylucene – Python
- Plucene – Perl