Blog der SHI GmbH

Apache Solr Indexe OHNE Re-Indexierung

Von Markus Klose I 07 September 2015
Veröffentlicht in ,

Apache Lucene/Solr Indexe OHNE Re-Indexierung auf die neuste Version bringen Mit jeder neuen Version von Apache Solr gibt es neue tolle Features und Verbesserungen, von denen man gerne profitieren möchte. Oft bedeutet dies, dass man den Index komplett neu aufbauen (re-indexieren) muss. Dieses bei jedem neuen Solr Release durchzuführen ist natürlich nicht praktikabel. So treffen […]

Weiterlesen
Blog der SHI GmbH

Log Visualisierung mit Lucidworks Fusion – Alles unter einem Dach

Von Markus Klose I 28 Mai 2015
Veröffentlicht in , ,

„Daten sind wie Rohöl!“ – Es steckt viel Potenzial in ihnen, aber man muss es erst herausholen.Heutzutage wird für die „Veredlung“ von Daten oft auf Software wie Splunk oder Nagios zurückgegriffen. Mit solchen Tools können Daten, wie beispielsweise Log Dateien, verarbeitet und vor allem visualisiert werden, d.h. mit Diagrammen, Charts usw. können beispielsweise Trends besser […]

Weiterlesen
Blog der SHI GmbH

Schema vs. Schemaless vs. Managed Schema

Von Markus Klose I 12 Mai 2015
Veröffentlicht in ,

Schema vs. Schemaless vs. Managed Schema – „Was ist was?“ und „Was passt am besten zu meiner Suche?“ Für eine gute Suche ist die Qualität des Indexes extrem wichtig. Die Qualität des Index setzt sich zum einem aus der Datenqualität und zum anderen aus der Verarbeitung der Daten während der Indexierung bzw. Suche zusammen. Diese […]

Weiterlesen
Blog der SHI GmbH

Flexibles Connector-Framework in Solr Integrieren – Lucidworks Fusion macht’s möglich

Von Markus Klose I 15 März 2015
Veröffentlicht in , ,

Eine der großen Herausforderung bei der Umsetzung einer Enterprise-Search ist die Anbindung der unterschiedlichsten Datenquellen. Jede Quelle hat ihre eigenen Schnittstellen, internen Strukturen und Daten bzw. Meta-Daten. Des Weiteren besitzen die Datenquellen eigene Sicherheitsmechanismen um den Zugriff auf die einzelnen Dokumente zu regeln.Möchte man nun eine Enterprise-Search Applikation mit Solr umsetzen steht man vor eben […]

Weiterlesen
Blog der SHI GmbH

Solr Cookbook Third Edition – eine Buchrezension

Von Markus Klose I 10 März 2015
Veröffentlicht in ,

Einstieg in Apache Solr Wie man richtig mit Apache Solr kocht? Diese Frage beantwortet Rafal Kuc in der aktuellen Ausgabe seines Apache Solr Cookbooks. In „Solr Cookbook Third Edition“ beschreibt er typische Probleme bzw. Anwendungsfälle und deren Lösungen. Das Buch richtet sich an Entwickler, die bereits Hintergrundwissen zu Apache Solr mitbringen. Für diejenigen, die noch […]

Weiterlesen
Blog der SHI GmbH

Search Cluster wirklich (ausfall)sicher?

Von Markus Klose I 10 Februar 2015
Veröffentlicht in , ,

Ist Ihr Search Cluster wirklich (ausfall)sicher??? Jepsen beweist es!!! Viele Anbieter und Produkte werben damit, dass große, skalierbare und performante Search Cluster leicht zu erstellen und zu warten sind. Weder mit Apache Solr noch mit Elasticsearch ist dies eine große Herausforderung. Beide Such-Server bieten eine ausgereifte API um neue Collections anzulegen, zu löschen, Aliase zu […]

Weiterlesen

SSL-Verwendung mit Apache Solr

Von Markus Klose I 09 September 2014
Veröffentlicht in ,

Bei Apache Solr gibt es grundlegend keine Sicherheitsmechanismen. Dies betrifft sowohl den Zugriff auf den Solr-Server selbst, als auch die einzelnen Dokumente. Natürlich gibt viele bewährte Workarounds hierfür. Beispielsweise kann man den Solr-Server im eigenen Netz so absichern, dass nur bestimmte Ports freigeschaltet werden. Für Dokumentsicherheit kann man ACL Informationen mit im Index abspeichern und […]

Weiterlesen

Monitoring mit Solr – Logstash to Solr

Von Markus Klose I 11 März 2014
Veröffentlicht in ,

Wie bereits im vergangenen Blog (Monitoring mit Solr) angedeutet, möchte ich hier nun auf die Möglichkeit eingehen, wie man Log-Dateien mittels Logstash verarbeiten kann, so dass diese anstelle in einem Elasticsearch Index in einem Solr Index landen.Logstash bietet eine Vielzahl von Plugins, sowohl für „input“, „filter“ oder „output“. Das Plugin für den Solr Output ist […]

Weiterlesen

Monitoring mit Solr

Von Markus Klose I 11 März 2014
Veröffentlicht in ,

Monitoring ist ein wichtiges Thema. Egal ob es sich um die technische Überwachung einer Serverlandschaft handelt oder beispielsweise um das Tracking des Userverhaltens beim Einkauf in einem Onlineshop. Es ist immer wichtig, gezielt nach Informationen wie Conversion-Rate oder CPU-Auslastung zu „suchen“, diese aufzubereiten und darzustellen.Sehr schnell kommt man bei diesem Thema mit dem ELK-Stack – […]

Weiterlesen

Document Routing in Solr – Update

Von Markus Klose I 21 Februar 2014
Veröffentlicht in ,

Mein Kollege Daniel Wrigley hatte vor gut einem Jahr bereits über das Document-Routing in Solr in einem Blogbeitrag berichtet. In diesem Jahr sind weitere Solr Versionen mit Anpassungen, Erweiterungen und neuen Features veröffentlicht worden. Die Änderungen betreffen auch das mit Solr 4.1 eingeführte Document Routing. Mit der Solr Version 4.5 wurde dieses Feature überarbeitet und […]

Weiterlesen