Blog der SHI GmbH

Apache Solr goes JSON

Von Markus Klose I 10 November 2015
Veröffentlicht in ,

Liest man die einschlägigen Dokumentationen zu Apache Solr, wird man immer wieder auf das sogenannte Solr XML stoßen. Mit diesem speziellen XML Format kann der Index leicht manipuliert werden. Viel mehr geht damit aber auch nicht. Seit einigen Versionen gibt es in Solr eine JSON API mit der man ebenfalls den Index manipulieren, aber auch […]

Weiterlesen
Blog der SHI GmbH

Solr 5 – Startskripte jetzt noch einfacher

Von Patricia Kraft I 05 November 2015
Veröffentlicht in ,

Das Starten von Solr-Instanzen war in der Vergangenheit oftmals nicht ganz vorbereitungslos zu bewerkstelligen. Die Schuld daran trugen vornehmlich die vielen, oft kryptisch wirkenden Parameter, deren Angabe obligatorischer Bestandteil des Solr-Startkommandos war. Verständnisprobleme, Fehlinterpretationen und Tippfehler seien hier nur als einige der Nachteile einer solchen Parameterliste genannt. Doch frustrierte Solr-Nutzer können nun aufatmen: Die 5.x-Versionen […]

Weiterlesen
Blog der SHI GmbH

Customer Journey Analytics im E-Commerce

Von Daniel Wrigley I 11 September 2015
Veröffentlicht in , ,

Anfangen, die Kunden kennen zu lernen Die Customer Journey ist ein in Marketingkreisen häufig genannter Begriff, der den Weg eines Kunden bis zum Kaufabschluss beschreibt. Nicht nur Global Player wie Amazon analysieren diese, um ihre Kunden besser zu verstehen und dieses Wissen gewinnbringend einsetzen zu können. Es handelt sich hierbei um ein zentrales Thema, sodass […]

Weiterlesen
Blog der SHI GmbH

Apache Solr Indexe OHNE Re-Indexierung

Von Markus Klose I 07 September 2015
Veröffentlicht in ,

Apache Lucene/Solr Indexe OHNE Re-Indexierung auf die neuste Version bringen Mit jeder neuen Version von Apache Solr gibt es neue tolle Features und Verbesserungen, von denen man gerne profitieren möchte. Oft bedeutet dies, dass man den Index komplett neu aufbauen (re-indexieren) muss. Dieses bei jedem neuen Solr Release durchzuführen ist natürlich nicht praktikabel. So treffen […]

Weiterlesen
Blog der SHI GmbH

Multiword SpellCheck

Von Daniel Fuckner I 24 August 2015
Veröffentlicht in ,

Multiword SpellCheck in Apache Solr unter Verwendung des Shingle-Filters Ein oftmals auftretendes Problem in Solr ist die Verwendung der SpellCheckComponent (Meinten Sie …) bei der Überprüfung mehrerer aufeinanderfolgender Begriffe, beispielsweise hinsichtlich der Begriffskombination „biig bang theory“.Die meisten Konfigurationen wenden die SpellCheckComponent in Solr auf einzelne Begriffe an. Sofern eine Query mit mehreren Begriffen an Solr […]

Weiterlesen
Blog der SHI GmbH

Past Solr Highlights

Von Daniel Wrigley I 10 Juli 2015
Veröffentlicht in ,

Die Entwicklung von Open Source Projekten schreitet oftmals rasant voran. Apache Solr bildet hier keine Ausnahme, sondern bestätigt diese Aussage ganz klar mit Release-Zyklen, die oftmals im Bereich von sechs bis acht Wochen liegen. Mit über einem Dutzend Releases in seit Anfang 2014 ist diese These nicht aus der Luft gegriffen, sondern auch mit Fakten […]

Weiterlesen
Blog der SHI GmbH

Wie neutral ist medienneutral?

Von Daniel Wrigley I 17 Juni 2015
Veröffentlicht in , , ,

„Unser Redaktionssystem verspricht medienneutrale Datenhaltung mittels XML – aber was dabei herauskommt ist in Wahrheit gar nicht medienneutral.“ Solche oder ähnliche Aussagen bekommt man öfter zu hören, sie geben die gelebte praktische Erfahrung in vielen Verlagen wieder.Schon seit vielen Jahren beschäftigen sich die Verlage landauf landab mit den Herausforderungen der sogenannten „Single-Source“-Produktion. Derzeit erhält das […]

Weiterlesen
Blog der SHI GmbH

Log Visualisierung mit Lucidworks Fusion – Alles unter einem Dach

Von Markus Klose I 28 Mai 2015
Veröffentlicht in , ,

„Daten sind wie Rohöl!“ – Es steckt viel Potenzial in ihnen, aber man muss es erst herausholen.Heutzutage wird für die „Veredlung“ von Daten oft auf Software wie Splunk oder Nagios zurückgegriffen. Mit solchen Tools können Daten, wie beispielsweise Log Dateien, verarbeitet und vor allem visualisiert werden, d.h. mit Diagrammen, Charts usw. können beispielsweise Trends besser […]

Weiterlesen
Blog der SHI GmbH

Schema vs. Schemaless vs. Managed Schema

Von Markus Klose I 12 Mai 2015
Veröffentlicht in ,

Schema vs. Schemaless vs. Managed Schema – „Was ist was?“ und „Was passt am besten zu meiner Suche?“ Für eine gute Suche ist die Qualität des Indexes extrem wichtig. Die Qualität des Index setzt sich zum einem aus der Datenqualität und zum anderen aus der Verarbeitung der Daten während der Indexierung bzw. Suche zusammen. Diese […]

Weiterlesen
Blog der SHI GmbH

Ab wann lohnt sich die Investition in ein Fachportal?

Von Andreas Steber I 30 April 2015
Veröffentlicht in , ,

Die Frage nach dem Return on Invest stellt sich jedem Verlag, der sich mit dem Gedanken trägt, ob er vorhandene Printprodukte durch ein Online-Fachportal ergänzen soll. Dabei spielt es keine grundsätzliche Rolle, ob das Printprodukt wie ein Loseblattwerk oder eine Fachzeitschrift laufend aktuelle Inhalte liefert, oder ob es sich um ein regelmäßig durch Neuauflagen aktualisiertes […]

Weiterlesen