Blog
Am 12. Juli 2016 wurde die Version 0.7.0 von Apache NiFi veröffentlicht, das auf Grund seiner einfachen Bedienbarkeit, seiner Performanz und seiner Datensicherheit zunehmend im Big Data Kontext und darüber hinaus Verwendung findet. Apache NiFi ermöglicht es, Workflows zu generieren, um Daten zu extrahieren, zu transformieren und weiterzuschicken. Darüber hinaus eignet sich NiFi, zum Monitoren […]
Ausfallsicherheit ist eines der wichtigsten Kriterien für die Wahl einer SolrCloud-Lösung statt der Nutzung der Solr-Single-Core-Variante. Durch das Hinzufügen von Replikas lassen sich die Indizes der einzelnen Shards einer Collection duplizieren und sichern damit die Daten für den Fall, dass ein Solr-Knoten ausfällt. Doch was, wenn gezielt ein bestimmter Zustand der SolrCloud gesichert werden soll, […]
Solr 6.1 Feature-Test – Mehr Toleranz bei Updateprozessoren TolerantUpdateProcessor Seit Mitte Juni steht Solr in der Version 6.1.0 zum Download bereit. Da es sich nur um ein Minor Release handelt, halten sich die Neuerungen in Grenzen. Ein zusätzliches Feature verdient es dennoch, erwähnt zu werden – die TolerantUpdateProcessorFactory. Wie der Name schon verrät handelt es […]
Wie bereits in vorangegangenen Blogbeiträgen vorgestellt, bietet Solr 6 einige neue Features. Außer der neuen SQL-Suchsyntax, dem neuen Scoring-Algorithmus und der Möglichkeit zur Graphentraversierung wurde auch die Streaming API um einige Befehle erweitert. Hinzugekommen sind unter anderem verteilte Joins und ein Ausdruck update zum Aktualisieren einer Collection in der SolrCloud. Funktionalität und Vorteile Über https://host:port/solr/stream?update(destCollection, […]
In diesen Tagen wird ein neues Minor-Release von Lucidworks Fusion veröffentlicht. Dieses bietet neben allgemeinen Verbesserungen natürlich auch einige Ansätze, die widerspiegeln was aktuelle Trends im Bereich Search und Big Data im Allgemeinen sind: Datenmodellierung, Indexierung von zeitbasierten Daten (Log-Events, von Usern generierte Daten, Tweets etc.) und bessere Integration von Tools im Bereich Machine Learning. […]
Das Release 6.0 von Apache Solr ist nun seit kurzem veröffentlicht. Mit dieser Version gibt es einige neue Funktionalitäten, aber auch einige teils gravierende Änderungen bestehender Funktionalitäten. Eine dieser Änderungen betrifft das Scoring. In Solr 6.0 ist der Default des Scoring-Mechanismus von der TF-IDF-Berechnung auf BM25 umgestellt worden.Im Januar hat meine Kollegin Patricia Kaufmann bereits […]
Warum sind Wildcard-Suchen und Stemmer teilweise inkompatibel? Mittels des Einsatzes von Wildcards können Suchen erweitert werden. Apache Solr unterstützt verschiedene Varianten von Wildcards. Beispielsweise kann mit variablen Buchstaben innerhalb eines Worts gesucht werden. Eine Suche nach w?ld führt beispielsweise zu Treffern bei Dokumenten, in denen die Begriffe wild oder wald vorkommen.Ein weiterer typischer Einsatz von […]
Wie wir in einem vorherigen Blog über die Neuheiten des nächsten Major Releases von Apache Solr bereits angekündigt hatten, werden in Solr 6 Suchanfragen auf Basis von SQL-Syntax möglich sein. Dieser Beitrag wird detaillierter auf diese Möglichkeit eingehen. Praktisch alle, die mit Solr in Berührung kommen und vorher mit relationalen Datenbanken gearbeitet haben, stellen sich […]
Veröffentlicht am 16.02.2016 von Patricia Kaufmann Eine Identifikationsnummer, eine ID, sollte schon dem Namen nach ein unverkennbares Merkmal sein mittels dessen man eine Person oder ein Objekt eindeutig von anderen abgrenzen kann. Dies gilt insbesondere für die Inhalte von Datenspeichern, seien es klassische relationale Datenbanken oder nicht-relationale Speicher, wie Apache Solr sie verwendet. Jedes Dokument […]
Die für das Frühjahr 2016 geplante Veröffentlichung der neuen Solr-Version 6 kann mit Spannung erwartet werden.Zu vielen Verbesserungen und Erweiterungen vorhandener Funktionalitäten, verspricht Solr 6 einige neue Features zu beinhalten.Dazu gehören parallele SQL-Abfragen, Graphen-Traversierung und ein neuer Scoring-Algorithmus zur Bewertung von Dokumenten in der Trefferliste. Parallele SQL-Anfragen Die Nachfrage nach einer Verschmelzung der Solr-Suche mit […]