Blog
Das Starten von Solr-Instanzen war in der Vergangenheit oftmals nicht ganz vorbereitungslos zu bewerkstelligen. Die Schuld daran trugen vornehmlich die vielen, oft kryptisch wirkenden Parameter, deren Angabe obligatorischer Bestandteil des Solr-Startkommandos war. Verständnisprobleme, Fehlinterpretationen und Tippfehler seien hier nur als einige der Nachteile einer solchen Parameterliste genannt. Doch frustrierte Solr-Nutzer können nun aufatmen: Die 5.x-Versionen […]
WeiterlesenApache Lucene/Solr Indexe OHNE Re-Indexierung auf die neuste Version bringen Mit jeder neuen Version von Apache Solr gibt es neue tolle Features und Verbesserungen, von denen man gerne profitieren möchte. Oft bedeutet dies, dass man den Index komplett neu aufbauen (re-indexieren) muss. Dieses bei jedem neuen Solr Release durchzuführen ist natürlich nicht praktikabel. So treffen […]
WeiterlesenMultiword SpellCheck in Apache Solr unter Verwendung des Shingle-Filters Ein oftmals auftretendes Problem in Solr ist die Verwendung der SpellCheckComponent (Meinten Sie …) bei der Überprüfung mehrerer aufeinanderfolgender Begriffe, beispielsweise hinsichtlich der Begriffskombination „biig bang theory“.Die meisten Konfigurationen wenden die SpellCheckComponent in Solr auf einzelne Begriffe an. Sofern eine Query mit mehreren Begriffen an Solr […]
WeiterlesenDie Entwicklung von Open Source Projekten schreitet oftmals rasant voran. Apache Solr bildet hier keine Ausnahme, sondern bestätigt diese Aussage ganz klar mit Release-Zyklen, die oftmals im Bereich von sechs bis acht Wochen liegen. Mit über einem Dutzend Releases in seit Anfang 2014 ist diese These nicht aus der Luft gegriffen, sondern auch mit Fakten […]
Weiterlesen„Unser Redaktionssystem verspricht medienneutrale Datenhaltung mittels XML – aber was dabei herauskommt ist in Wahrheit gar nicht medienneutral.“ Solche oder ähnliche Aussagen bekommt man öfter zu hören, sie geben die gelebte praktische Erfahrung in vielen Verlagen wieder.Schon seit vielen Jahren beschäftigen sich die Verlage landauf landab mit den Herausforderungen der sogenannten „Single-Source“-Produktion. Derzeit erhält das […]
Weiterlesen„Daten sind wie Rohöl!“ – Es steckt viel Potenzial in ihnen, aber man muss es erst herausholen.Heutzutage wird für die „Veredlung“ von Daten oft auf Software wie Splunk oder Nagios zurückgegriffen. Mit solchen Tools können Daten, wie beispielsweise Log Dateien, verarbeitet und vor allem visualisiert werden, d.h. mit Diagrammen, Charts usw. können beispielsweise Trends besser […]
WeiterlesenSchema vs. Schemaless vs. Managed Schema – „Was ist was?“ und „Was passt am besten zu meiner Suche?“ Für eine gute Suche ist die Qualität des Indexes extrem wichtig. Die Qualität des Index setzt sich zum einem aus der Datenqualität und zum anderen aus der Verarbeitung der Daten während der Indexierung bzw. Suche zusammen. Diese […]
WeiterlesenWie lange „lebt“ ein Dokument? Oder: Wie man ein Ablaufdatum an Inhalte heftet Seit Solr 4.8 gibt es ein Feature, das aktuell noch nicht besonders dokumentiert und sich daher auch noch nicht weiter Verbreitung erfreuen kann: Document Expiration. Mit dieser Funktionalität kann ich Dokumente basierend auf einem Datumsfeld in regelmäßigen Löschvorgängen aus einem Solr Index […]
WeiterlesenDer Such-Server Apache Solr ist in Version 5.1.0 erschienen. Er beinhaltet 39 neue Features, 40 Bugfixes und 36 Optimierungen der vor kurzem veröffentlichten Version 5.1.Die Bugfixes beheben unter anderem Probleme, die die API oder SolrCloud betreffen.Die vollständige Liste der Verbesserungen und Änderungen kann unter dem folgenden Link gesichtet werden:https://lucene.apache.org/solr/5_1_0/changes/Changes.htmlDie aktuelle Version kann auf der Apache […]
WeiterlesenErfahrungsbericht zur Teilnahme an den Kursen „Solr Unleashed“ und „Solr Under the Hood“ Als neues Mitglied des Consulting-Teams der SHI GmbH habe ich zwischen dem 23.03. – 24.03.2015 am Kurs „Solr Unleashed“ und anschließend zwischen dem 25.03. – 26.03.2015 am Kurs „Solr Under the Hood“ teilgenommen. Das Ziel der Teilnahme am Kurs „Solr Unleashed“ war […]
Weiterlesen