Blog
Smartes Autosuggest mittels Signals und Aggregation. Wie Suchvorschläge stets die aktuellen Trends und Interessen Ihrer Kunden wiederspiegeln.
WeiterlesenLaut GitHub steht Solr 7.4.0 als nächstes Release fest.
WeiterlesenA solid Distributed System Awaits. Ein Rückblick von Mark Miller wie die heutige SolrCloud einst das Licht der Welt erblickte und welche neuen Features uns in den kommenden Releases erwarten wird. Der Grundstock für die heutige SolrCloud wurde 2009 von Mark Miller zusammen mit Yonik Seeley gelegt. Sie entschieden sich, die bewerte Master-Slave Architektur durch […]
WeiterlesenTesting your Needs – The Apache NiFi Test Framework In this last part of our NiFi blog series, we will have a deeper look into NiFi’s test framework. To demonstrate the key concepts, we will write some JUnit tests for our custom LogCustomMessage processor that we implemented in the second part. First things First […]
WeiterlesenHow NiFi fits into your needs; Part 2 In Part 1 of this series we had a look at the general concepts of NiFi and how NiFi can help moving your data a level higher. In Part 2 we will look at the extension points NiFi is providing, especially the most important one the ‘Processor […]
WeiterlesenWhat is NiFi and how can it help moving up data a level higher – Part 1 Apache NiFi is a powerful system to process and distribute data across different systems. It enables the automation of data flows and can be seen as a data logistic platform.Data can be processed in real time, in batches […]
WeiterlesenIn einem früheren Blog habe ich einen kurzen Einblick in Apache Stanbol und Named Entity Recognition (NER) gegeben. Die gezeigte Oberfläche war der Stanbol Enhancer. Er ist dafür zuständig, Entitäten im Fließtext zu erkennen.In diesem Beitrag will ich etwas näher auf den sogenannten Contenthub eingehen, der ebenfalls Teil von Apache Stanbol ist. Der Contenthub besteht […]
WeiterlesenIn einem früheren Beitrag bin ich bereits etwas näher auf das Thema Stemming in der Analysekette von Solr (https://www.shi-gmbh.com/blog/solr-analysekette-stemming/) eingegangen. Neben der Bedeutung von Stemming für die Suchtechnologie habe ich auch den Einsatz des Porter-Stemmers in Solr beschrieben, ebenso wie die Erweiterungen durch den KeywordMarkerFilter (Wörter als Keywords markieren, um Stemming zu vermeiden) und den […]
WeiterlesenSemantische Suche ist in aller Munde und hat in den letzten Jahren einen erheblichen Sprung gemacht, was Ihre Bedeutung im Rahmen von Suchtechnologie angeht.Doch was ist Semantische Suche eigentlich? Um diese Frage zu beantworten, ist es notwendig zu verstehen, was Semantik im sprachwissenschaftlichen Sinne bedeutet. Semantik ist die Lehre der Bedeutung. Hierbei geht es also […]
WeiterlesenWie bereits in einem vorangegangen Artikel “Tipp – Mehrere Collections in einer SolrCloud verwalten” angedeutet, bietet Solr die Möglichkeit mit dem ZooKeeper über eine im Solr integrierte Command Line API zu kommunizieren. Die Möglichkeiten, die uns hier geboten werden, möchte ich in diesem Beitrag näher beleuchten. Mir der im Solr intergierten ZooKeeper CLI können relevante Operationen abgedeckt […]
Weiterlesen