Apache Solr
Leistungsfähige Suchtechnologie, überall einsetzbar
1
Was ist Apache Solr?
Solr ist die beliebteste, superschnelle Open Source Enterprise Search Plattform, die auf Apache Lucene™ basiert.
Leistungsfähige Volltextsuchtechnologie á la Google erscheint uns heute im Internet fast wie eine Selbstverständlichkeit. Soll Suchtechnologie jedoch im Unternehmen, in Web-Shops oder gar innerhalb von Applikationen zum Einsatz kommen, so sind fertige Module gefragt, die von Softwareentwicklern verwendet werden können.
Apache Solr
Der Search Server mit vielen Zusatzfunktionen
Wesentliche Erleichterung bei Entwicklung und Betrieb von Such-Lösungen schafft hier Apache Solr. Apache Solr ist die „Serverversion“ von Lucene. Apache Solr verwendet die Lucene Search Engine Library und erweitert diese um eine Vielzahl von Funktionen und läuft in verbreiteten Servlet Containern wie Tomcat oder Jetty. Mit seinen REST-Schnittstellen und der XML-basierten Konfiguration lassen sich ansprechende Suchlösungen realisieren. Tatsächlich berichten viele Entwickler, dass Sie in Apache Solr die Funktionalitäten gefunden haben, die Sie für Lucene erst hätten entwickeln müssen.
Apache Solr bietet Entwicklern auf Basis von Standard-Webtechnologien eine mächtige und dabei einfach zu integrierende und zu benutzende Search Engine, die überall einsetzbar ist. Apache Solr setzt dabei konsequent auf Konfigurierbarkeit. Die zahlreichen „out of the box“-Module und die offenen Schnittstellen bieten dabei reichhaltige und effiziente Mittel zum Aufbau von Search Solutions.
Apache Solr in Kürze:
- Open Source Suchplattform für die Volltextsuche
- Aufgebaut als Framework auf Apache Lucene
- Bereitstellung von konfigurierbaren Such-Features wie Highlighting und Facettierung
- RESTful API für Indexierung, Suche und Konfigurationsmanagement
- Benutzeroberfläche für Index-Analyse und Cluster-Konfiguration
- Horizontal und vertikal skalierbar
- Automatische Indexreplikation sowie flexible Failover- und Recovery-Strategien
- Near Real-Time Indexierung und Suche
- Erweiterbare Plugin-Architektur
2
Wofür kann ich Apache Solr nutzen?
Apache Solr macht viele unterschiedliche Datenquellen und Dateiformate zentral durchsuchbar
- Unstrukturierte Daten (Mails, Textdokumente)
- Binärdaten (Excel, PowerPoint, PDFs, …)
- Geodaten
- Datenbanken
- Webseiten
Bei dieser Fülle an verschiedenen Daten ist klar, dass eine robuste Suche Dreh- und Angelpunkt für das Aufbrechen existierender Datensilos ist. Solr ist dabei die Basis, um in verschiedenen Bereichen die wichtigen Informationen zusammenzubringen und so echten Mehrwert zu erzeugen.
3
Warum sollte ich mich für Apache Solr entscheiden?
Solr hat sich in Bezug auf Zuverlässigkeit, Skalierbarkeit und Geschwindigkeit bewährt
- Echtzeit-Suche
- Explorative Data-Analytics
- Programmiersprachen agnostisch
- Skalierung
Egal, welche Anforderungen Sie an Solr stellen, es ist eine passende Konfiguration möglich. Egal ob es sich dabei um Bedingungen der Antwortzeiten, der Aufbereitung der Daten handelt, sich um die Größe und Ausfallsicherheit ihre Daten dreht oder wie ihr Software Stack ausschaut.
- On-premise
- Virtualisiert
- Cloud-Anbieter
Als Open Source Lösung ist Solr überall einsetzbar. Die Entscheidung liegt bei Ihnen. Egal, wie Sie sich entscheiden, wir bieten Ihnen die optimale Unterstützung dabei.
4
Für wen eignet sich Apache Solr?
Apache Solr ist beispielsweise für die folgenden Personen die richtige Lösung:
- Sie betreiben einen Online Shop oder eine E-Commerce Lösung und Ihre Besucher sollen schnell, einfach und intuitiv alle gesuchten Produkte finden?
- Ihr Unternehmen hat unzählige wichtige Dokumente und Informationen in
vielen verschiedenen Systemen und Sie möchten dieses Wissen nutzen – so einfach wie bei Google?
- Sie haben ein Web-Portal und möchten, dass Ihre Besucher schnell Artikel, Dokumentationen, Produktinformationen durchsuchen und durch tausende Seiten navigieren können?
- Sie sind Hersteller einer CRM-, CMS- oder einer Branchen-Lösung und die Datenbanksuche ist zu umständlich, zu langsam oder
nicht fehlertolerant genug?
Sie haben Interesse an unserem Grundkurs „Solr in a Nutshell“ oder unserem Aufbaukurs „Solr in Production“?
Möchten Sie wissen, wie Sie Apache Solr für sich nutzen können?
Profitieren Sie von unserem gebündelten Wissen zu Apache Solr!
Blogbeitrag von Jirayu Tharincharoen
Inhalt des Beitrags:
- Wann ist ein Schreibfehler ein Problem in Solr?
- Was ist die SpellChecking-Komponente?
- DirectSolrSpellChecker zum Finden von Tippfehlern
- WordBreakSpellChecker zum Finden von Schreibfehlern
Blogbeitrag von Jirayu Tharincharoen
Inhalt des Beitrags:
- Was sind CharFilter?
- Welche CharFilter gibt es in Solr?
- PatternReplaceCharFilterFactory
- HTMLStripCharFilterFactory
- MappingCharFilterFactory
- CharFilter, Tokenizer und Filter für Ihren Anwendungsfall
Blogbeitrag von Patricia Kraft
Inhalt des Beitrags:
- Was sind Solr Tokenizer?
- Tokenizer für Datenfelder: Leerzeichen zum Treffen von Begriffen
- Tokenizer für Fließtext: Leer-, Sonder- und Interpunktionszeichen zum Begriffstrennen
- Tokenizer für Identifizierer: Individuelle Zeichenketten zum Begriffe trennen
- Tokenizer für andere Daten