Blog der SHI GmbH

Cross Collection Data Shifting

Von Patricia Kraft I 18 Mai 2016
Veröffentlicht in ,

Wie bereits in vorangegangenen Blogbeiträgen vorgestellt, bietet Solr 6 einige neue Features. Außer der neuen SQL-Suchsyntax, dem neuen Scoring-Algorithmus und der Möglichkeit zur Graphentraversierung wurde auch die Streaming API um einige Befehle erweitert. Hinzugekommen sind unter anderem verteilte Joins und ein Ausdruck update zum Aktualisieren einer Collection in der SolrCloud. Funktionalität und Vorteile Über https://host:port/solr/stream?update(destCollection, […]

Weiterlesen
Blog der SHI GmbH

Fusion 2.3

Von Daniel Wrigley I 09 Mai 2016
Veröffentlicht in , ,

In diesen Tagen wird ein neues Minor-Release von Lucidworks Fusion veröffentlicht. Dieses bietet neben allgemeinen Verbesserungen natürlich auch einige Ansätze, die widerspiegeln was aktuelle Trends im Bereich Search und Big Data im Allgemeinen sind: Datenmodellierung, Indexierung von zeitbasierten Daten (Log-Events, von Usern generierte Daten, Tweets etc.) und bessere Integration von Tools im Bereich Machine Learning. […]

Weiterlesen
Blog der SHI GmbH

Scoring BM25

Von Markus Klose I 06 Mai 2016
Veröffentlicht in , ,

Das Release 6.0 von Apache Solr ist nun seit kurzem veröffentlicht. Mit dieser Version gibt es einige neue Funktionalitäten, aber auch einige teils gravierende Änderungen bestehender Funktionalitäten. Eine dieser Änderungen betrifft das Scoring. In Solr 6.0 ist der Default des Scoring-Mechanismus von der TF-IDF-Berechnung auf BM25 umgestellt worden.Im Januar hat meine Kollegin Patricia Kaufmann bereits […]

Weiterlesen
Blog der SHI GmbH

Wildcard-Suchen und Stemmer

Von Patricia Kraft I 07 April 2016
Veröffentlicht in ,

Warum sind Wildcard-Suchen und Stemmer teilweise inkompatibel? Mittels des Einsatzes von Wildcards können Suchen erweitert werden. Apache Solr unterstützt verschiedene Varianten von Wildcards. Beispielsweise kann mit variablen Buchstaben innerhalb eines Worts gesucht werden. Eine Suche nach w?ld führt beispielsweise zu Treffern bei Dokumenten, in denen die Begriffe wild oder wald vorkommen.Ein weiterer typischer Einsatz von […]

Weiterlesen
Blog der SHI GmbH

Solr 6 Parallel SQL

Von Daniel Wrigley I 02 März 2016
Veröffentlicht in ,

Wie wir in einem vorherigen Blog über die Neuheiten des nächsten Major Releases von Apache Solr bereits angekündigt hatten, werden in Solr 6 Suchanfragen auf Basis von SQL-Syntax möglich sein. Dieser Beitrag wird detaillierter auf diese Möglichkeit eingehen. Praktisch alle, die mit Solr in Berührung kommen und vorher mit relationalen Datenbanken gearbeitet haben, stellen sich […]

Weiterlesen
Blog der SHI GmbH

Duplizierte IDs identifizieren mit Solr 6

Von Patricia Kraft I 16 Februar 2016
Veröffentlicht in ,

Veröffentlicht am 16.02.2016 von Patricia Kaufmann Eine Identifikationsnummer, eine ID, sollte schon dem Namen nach ein unverkennbares Merkmal sein mittels dessen man eine Person oder ein Objekt eindeutig von anderen abgrenzen kann. Dies gilt insbesondere für die Inhalte von Datenspeichern, seien es klassische relationale Datenbanken oder nicht-relationale Speicher, wie Apache Solr sie verwendet. Jedes Dokument […]

Weiterlesen
Blog der SHI GmbH

Solr 6 – coming soon

Von Patricia Kraft I 27 Januar 2016
Veröffentlicht in ,

Die für das Frühjahr 2016 geplante Veröffentlichung der neuen Solr-Version 6 kann mit Spannung erwartet werden.Zu vielen Verbesserungen und Erweiterungen vorhandener Funktionalitäten, verspricht Solr 6 einige neue Features zu beinhalten.Dazu gehören parallele SQL-Abfragen, Graphen-Traversierung und ein neuer Scoring-Algorithmus zur Bewertung von Dokumenten in der Trefferliste. Parallele SQL-Anfragen Die Nachfrage nach einer Verschmelzung der Solr-Suche mit […]

Weiterlesen
Blog der SHI GmbH

Solr 5.4.0 – Mehr als nur UI Optimierungen

Von Daniel Wrigley I 16 Dezember 2015
Veröffentlicht in ,

Kürzlich wurde Solr 5.4.0 veröffentlicht, welches wieder zahlreiche Verbesserungen, Optimierungen und Bugfixes beinhaltet.Eine zentrale und offensichtliche Änderung ist die Einführung einer neuen auf Angular basierende UI, die nun eine Administration der Collections und die Manipulation des Schemas (u.a. Hinzufügen/Löschen von Feldern) im Browser ermöglicht. Dies haben wir bereits in einem anderen Beitrag vorgestellt. Doch die […]

Weiterlesen
Blog der SHI GmbH

Admin UI in Solr 5.4 goes Collectionhandling

Von Patricia Kraft I 09 Dezember 2015
Veröffentlicht in ,

Die SolrCloud besticht im Vergleich zu allein agierenden Solr-Instanzen durch eine Vielzahl an Features. Die Collections-API stellt alle nötigen Kommandos bereit, um die SolrCloud auf Ihre Bedürfnisse zuzuschneiden und Ihre Daten sinnvoll zu verteilen bzw. zu duplizieren. Laut Ankündigung auf der Lucence/Solr Revolution 2015, werden diese Funktionalitäten in Solr 5.4 nun auch über die Administrator-Oberfläche […]

Weiterlesen
Blog der SHI GmbH

Dokumentverteilung in der SolrCloud

Von Markus Klose I 30 November 2015
Veröffentlicht in ,

Dokumentverteilung in der SolrCloud – Optimale Verteilung für optimale Suchperformance In einer SolrCloud werden die Dokumente auf alle verfügbaren Shards einer Collection verteilt. Dies geschieht mehr oder minder automatisch. Mit diesem Verteilen der Dokumente wird sichergestellt, dass die einzelnen Indexe nicht zu groß werden und die Suche somit performant bleibt. Bei einer Suche muss man […]

Weiterlesen