Blog
Sprachidentifizerung mit Solr zur Indexierungszeit Solr kann Sprachen während der Indexierung erkennen. Dazu benutzt man den langid UpdateRequestProcessor.Hierzu werden zwei Implementierungen angeboten:Das Feature von Tika Sprachen zu identifizieren: https://tika.apache.org/0.10/api/org/apache/tika/language/LanguageIdentifier.htmlLangDetect Sprachidentifizierung basierend auf einer Java Library: https://code.google.com/p/language-detection/ Konfiguration des UpdateRequestProcessors:Der UpdateRequestProcessor wird in der solrconfig.xml konfiguriert. Es muss zumindest ein Feld, welches Grundlage (also Input) der […]
WeiterlesenStand heute Das Thema Suchfunktion in Online-Shops ist nicht gerade neu. Die Shop-Betreiber haben die Bedeutung einer intelligenten und optimierten Produktsuche als „Conversion Engine“ längst erkannt. In der Studie von ibi research , die erst kürzlich veröffentlicht wurde, wird das bestätigt. So kommt die Studie zu dem Ergebnis, dass 70% aller befragten Online-Händler eine optimierte […]
WeiterlesenCaches sind ein wesentlicher Faktor für die Performance des Search Servers Apache Solr. Nur wer diese Caches, ihre jeweilige Aufgabe und ihre Funktionsweise kennt, kann von Anfang an Performance-Engpässe vermeiden und das Maximale aus seiner Solr Installation herausholen.In Solr gibt es im Gegensatz zur reinen Lucene API mehrere verschiedene Arten von Caches. FilterCache QueryCache DocumentCache […]
Weiterlesen