Blog_allgemein

Past Solr Highlights

Daniel Wrigley

Die Entwicklung von Open Source Projekten schreitet oftmals rasant voran. Apache Solr bildet hier keine Ausnahme, sondern bestätigt diese Aussage ganz klar mit Release-Zyklen, die oftmals im Bereich von sechs bis acht Wochen liegen. Mit über einem Dutzend Releases in seit Anfang 2014 ist diese These nicht aus der Luft gegriffen, sondern auch mit Fakten zu hinterlegen. Dass in dieser Zeit sogar ein Major Release von Solr veröffentlicht wurde, verdeutlicht diesen Sachverhalt zusätzlich.

Diese Releases sind natürlich nicht nur Zahlenspielerei, sondern auch mit Inhalt gefüllt. Natürlich sind einige Features hinzugekommen, aber es wurde auch sehr viel in die Stabilität und Robustheit von Solr und dessen Zusammenspiel mit ZooKeeper investiert.
Nachfolgend habe ich meine persönlichen Highlights der letzten Releases auf Feature-Ebene kurz zusammengefasst.

Solr Security – SSL Support & Security Framework

Während SSL Support bereits seit einiger Zeit für Solr und auch SolrCloud zur Verschlüsselung der Kommunikation zwischen Clients bzw. SolrCloud Nodes mittels SSL verfügbar ist, ist das Security Framework brandneu erst kürzlich mit Solr 5.2 eingeführt worden. Letzteres ermöglicht Identitätsprüfung sowie Zugriffsbeschränkung auf Ressourcen eines Solr Clusters. Für die Einbindung von Authentifizierung ist ein Kerberos Plugin im Lieferumfang von Solr enthalten, für Autorisierung können Plugins mittels Extensio des Interface AutorizationPlugin erstellt werden.
Weitere Informationen:
SSL-Verwendung mit Apache Solr
Solr Reference Guide – Enabling SSL

Backup & Restore

 Einigen ist sicherlich bekannt, dass mittels ReplicationHandler schon seit geraumer Zeit das Erstellen von Index-Backups auf Core-Ebene möglich ist. Das Einspielen von solch erstellten Backups war aber bisher immer mit manuellem Aufwand verbunden. Dies hat sich nun grundlegend geändert, nachdem die Restore API kürzlich, ebenfalls Solr 5.2, veröffentlicht wurde. Dass eine Funktion für das Wiederherstellen von Backups nicht schon seit der Möglichkeit des Erstellens von Backups möglich war, mag komisch erscheinen – umso erfreulicher ist die Verfügbarkeit dieser äußerst nützlichen Funktion.

Solr Suggester

Dass Autosuggest ein zentrales Feature in mittlerweile beinahe schon allen auf Suche basierenden Anwendungen ist, ist längst kein Geheimnis mehr. Auch ließen sich solche Funktionalitäten mit Solr auf mehreren Wegen realisieren:

  • SpellCheckComponent
  • TermsComponent
  • FacetComponent
  • Wildcard-Search
  • Indexierung von NGrammen

Mit Solr 4.7 ist eine neue Komponente eingeführt worden, SuggestComponent, die die bereits in Lucene enthaltenen Module voll nutzen kann und eine Verwendung in verteilten Systemen ermöglicht. Implementierungen für die Lookups sind mittels einfacher Plugin-Architektur möglich, sodass anspruchsvolle Lösungen ohne die Limitierungen früherer Ansätze machbar sind.

Weitere Informationen:
Solr Reference Guide – Suggester

DocumentExpiration

Eine „Time-to-live“-Funktion bzw. das Anheften eines Ablaufdatums an Dokumente hat in Solr bis zur Version 4.8 gefehlt. Doch das wurde mit Einführung der DocExpirationUpdateRequestProcessorFactory behoben. Dazu und wie man UpdateRequestProcessor inklusive Document Expiration konfigurieren kann, habe ich bereits einen Blog verfasst.
Weitere Informationen:
Lucidworks Blog – New in Solr 4.8: Document Expiration