Blog
„Daten sind wie Rohöl!“ – Es steckt viel Potenzial in ihnen, aber man muss es erst herausholen.Heutzutage wird für die „Veredlung“ von Daten oft auf Software wie Splunk oder Nagios zurückgegriffen. Mit solchen Tools können Daten, wie beispielsweise Log Dateien, verarbeitet und vor allem visualisiert werden, d.h. mit Diagrammen, Charts usw. können beispielsweise Trends besser […]
Schema vs. Schemaless vs. Managed Schema – „Was ist was?“ und „Was passt am besten zu meiner Suche?“ Für eine gute Suche ist die Qualität des Indexes extrem wichtig. Die Qualität des Index setzt sich zum einem aus der Datenqualität und zum anderen aus der Verarbeitung der Daten während der Indexierung bzw. Suche zusammen. Diese […]
Die Frage nach dem Return on Invest stellt sich jedem Verlag, der sich mit dem Gedanken trägt, ob er vorhandene Printprodukte durch ein Online-Fachportal ergänzen soll. Dabei spielt es keine grundsätzliche Rolle, ob das Printprodukt wie ein Loseblattwerk oder eine Fachzeitschrift laufend aktuelle Inhalte liefert, oder ob es sich um ein regelmäßig durch Neuauflagen aktualisiertes […]
Wie lange „lebt“ ein Dokument? Oder: Wie man ein Ablaufdatum an Inhalte heftet Seit Solr 4.8 gibt es ein Feature, das aktuell noch nicht besonders dokumentiert und sich daher auch noch nicht weiter Verbreitung erfreuen kann: Document Expiration. Mit dieser Funktionalität kann ich Dokumente basierend auf einem Datumsfeld in regelmäßigen Löschvorgängen aus einem Solr Index […]
Der Such-Server Apache Solr ist in Version 5.1.0 erschienen. Er beinhaltet 39 neue Features, 40 Bugfixes und 36 Optimierungen der vor kurzem veröffentlichten Version 5.1.Die Bugfixes beheben unter anderem Probleme, die die API oder SolrCloud betreffen.Die vollständige Liste der Verbesserungen und Änderungen kann unter dem folgenden Link gesichtet werden:https://lucene.apache.org/solr/5_1_0/changes/Changes.htmlDie aktuelle Version kann auf der Apache […]
Lange Zeit haben Fachverlage ihr Heil darin gesucht, ihre Produkte immer spitzer zu vermarkten und noch in die entlegensten Nischen hinein zu entwickeln. Hohe Produktivitätszuwächse durch Automatisierung im Datenworkflow, die Möglichkeiten umfangreicher Zweitverwertungen vorhandener Inhalte und die Durchsetzbarkeit hoher Preise am Markt ermöglichten auch bei geringen Auflagen gute Gewinne. Kalkuliert wurde auf Basis bekannter Druckkosten, […]
Erfahrungsbericht zur Teilnahme an den Kursen „Solr Unleashed“ und „Solr Under the Hood“ Als neues Mitglied des Consulting-Teams der SHI GmbH habe ich zwischen dem 23.03. – 24.03.2015 am Kurs „Solr Unleashed“ und anschließend zwischen dem 25.03. – 26.03.2015 am Kurs „Solr Under the Hood“ teilgenommen. Das Ziel der Teilnahme am Kurs „Solr Unleashed“ war […]
Eine der großen Herausforderung bei der Umsetzung einer Enterprise-Search ist die Anbindung der unterschiedlichsten Datenquellen. Jede Quelle hat ihre eigenen Schnittstellen, internen Strukturen und Daten bzw. Meta-Daten. Des Weiteren besitzen die Datenquellen eigene Sicherheitsmechanismen um den Zugriff auf die einzelnen Dokumente zu regeln.Möchte man nun eine Enterprise-Search Applikation mit Solr umsetzen steht man vor eben […]
Einstieg in Apache Solr Wie man richtig mit Apache Solr kocht? Diese Frage beantwortet Rafal Kuc in der aktuellen Ausgabe seines Apache Solr Cookbooks. In „Solr Cookbook Third Edition“ beschreibt er typische Probleme bzw. Anwendungsfälle und deren Lösungen. Das Buch richtet sich an Entwickler, die bereits Hintergrundwissen zu Apache Solr mitbringen. Für diejenigen, die noch […]
Ist Ihr Search Cluster wirklich (ausfall)sicher??? Jepsen beweist es!!! Viele Anbieter und Produkte werben damit, dass große, skalierbare und performante Search Cluster leicht zu erstellen und zu warten sind. Weder mit Apache Solr noch mit Elasticsearch ist dies eine große Herausforderung. Beide Such-Server bieten eine ausgereifte API um neue Collections anzulegen, zu löschen, Aliase zu […]