Blog
In diesen Tagen wird ein neues Minor-Release von Lucidworks Fusion veröffentlicht. Dieses bietet neben allgemeinen Verbesserungen natürlich auch einige Ansätze, die widerspiegeln was aktuelle Trends im Bereich Search und Big Data im Allgemeinen sind: Datenmodellierung, Indexierung von zeitbasierten Daten (Log-Events, von Usern generierte Daten, Tweets etc.) und bessere Integration von Tools im Bereich Machine Learning. […]
WeiterlesenDas Release 6.0 von Apache Solr ist nun seit kurzem veröffentlicht. Mit dieser Version gibt es einige neue Funktionalitäten, aber auch einige teils gravierende Änderungen bestehender Funktionalitäten. Eine dieser Änderungen betrifft das Scoring. In Solr 6.0 ist der Default des Scoring-Mechanismus von der TF-IDF-Berechnung auf BM25 umgestellt worden.Im Januar hat meine Kollegin Patricia Kaufmann bereits […]
WeiterlesenWarum sind Wildcard-Suchen und Stemmer teilweise inkompatibel? Mittels des Einsatzes von Wildcards können Suchen erweitert werden. Apache Solr unterstützt verschiedene Varianten von Wildcards. Beispielsweise kann mit variablen Buchstaben innerhalb eines Worts gesucht werden. Eine Suche nach w?ld führt beispielsweise zu Treffern bei Dokumenten, in denen die Begriffe wild oder wald vorkommen.Ein weiterer typischer Einsatz von […]
WeiterlesenWie wir in einem vorherigen Blog über die Neuheiten des nächsten Major Releases von Apache Solr bereits angekündigt hatten, werden in Solr 6 Suchanfragen auf Basis von SQL-Syntax möglich sein. Dieser Beitrag wird detaillierter auf diese Möglichkeit eingehen. Praktisch alle, die mit Solr in Berührung kommen und vorher mit relationalen Datenbanken gearbeitet haben, stellen sich […]
WeiterlesenVeröffentlicht am 16.02.2016 von Patricia Kaufmann Eine Identifikationsnummer, eine ID, sollte schon dem Namen nach ein unverkennbares Merkmal sein mittels dessen man eine Person oder ein Objekt eindeutig von anderen abgrenzen kann. Dies gilt insbesondere für die Inhalte von Datenspeichern, seien es klassische relationale Datenbanken oder nicht-relationale Speicher, wie Apache Solr sie verwendet. Jedes Dokument […]
WeiterlesenDie für das Frühjahr 2016 geplante Veröffentlichung der neuen Solr-Version 6 kann mit Spannung erwartet werden.Zu vielen Verbesserungen und Erweiterungen vorhandener Funktionalitäten, verspricht Solr 6 einige neue Features zu beinhalten.Dazu gehören parallele SQL-Abfragen, Graphen-Traversierung und ein neuer Scoring-Algorithmus zur Bewertung von Dokumenten in der Trefferliste. Parallele SQL-Anfragen Die Nachfrage nach einer Verschmelzung der Solr-Suche mit […]
WeiterlesenKürzlich wurde Solr 5.4.0 veröffentlicht, welches wieder zahlreiche Verbesserungen, Optimierungen und Bugfixes beinhaltet.Eine zentrale und offensichtliche Änderung ist die Einführung einer neuen auf Angular basierende UI, die nun eine Administration der Collections und die Manipulation des Schemas (u.a. Hinzufügen/Löschen von Feldern) im Browser ermöglicht. Dies haben wir bereits in einem anderen Beitrag vorgestellt. Doch die […]
WeiterlesenDie SolrCloud besticht im Vergleich zu allein agierenden Solr-Instanzen durch eine Vielzahl an Features. Die Collections-API stellt alle nötigen Kommandos bereit, um die SolrCloud auf Ihre Bedürfnisse zuzuschneiden und Ihre Daten sinnvoll zu verteilen bzw. zu duplizieren. Laut Ankündigung auf der Lucence/Solr Revolution 2015, werden diese Funktionalitäten in Solr 5.4 nun auch über die Administrator-Oberfläche […]
WeiterlesenDokumentverteilung in der SolrCloud – Optimale Verteilung für optimale Suchperformance In einer SolrCloud werden die Dokumente auf alle verfügbaren Shards einer Collection verteilt. Dies geschieht mehr oder minder automatisch. Mit diesem Verteilen der Dokumente wird sichergestellt, dass die einzelnen Indexe nicht zu groß werden und die Suche somit performant bleibt. Bei einer Suche muss man […]
WeiterlesenLiest man die einschlägigen Dokumentationen zu Apache Solr, wird man immer wieder auf das sogenannte Solr XML stoßen. Mit diesem speziellen XML Format kann der Index leicht manipuliert werden. Viel mehr geht damit aber auch nicht. Seit einigen Versionen gibt es in Solr eine JSON API mit der man ebenfalls den Index manipulieren, aber auch […]
Weiterlesen