Tipp – Mehrere Collections in einer SolrCloud verwalten

Von Johannes Brucher I 11 April 2013
Veröffentlicht in ,

Die meisten Konfigurationen und Beispiele zur SolrCloud, die man in der Literatur findet, gehen davon aus, dass man pro Solr Instanz nur einen Core hat und somit in der SolrCloud auch nur eine einzige Collection existiert. Dass dies nicht zwingend so sein muss, habe ich bereits in den vergangenen Artikeln angedeutet. Nun möchte ich aufzeigen, […]

Weiterlesen
Blog der SHI GmbH

Apache Solr in PHP Projekten

Von Johannes Brucher I 10 April 2013
Veröffentlicht in ,

Längst hat der Suchserver Solr auch das PHP Umfeld erobert.Für alle gängigen Content-Management-Systeme wie TYPO3, Drupal oder Joomla! existieren Erweiterungen, um eine komfortable Anbindung des jeweiligen Systems an Solr zu bewerkstelligen. Aber wie ist vorzugehen, wenn in einem PHP Projekt kein CMS-Bolide zum Einsatz kommt und die Solr Anbindung individuell umgesetzt werden muss? Dem Entwickler […]

Weiterlesen

Externe Zookeeper

Von Johannes Brucher I 28 März 2013
Veröffentlicht in ,

Externe Zookeeper / Neuer Artikel der Blogserie “SolrCloud – Tipps, Tricks und Pitfalls” Wie bereits beschrieben, kann die SolrCloud sowohl mit integriertem ZooKeeper als auch mit einem externen ZooKeeper (Ensemble) betrieben werden. Bei der Funktionalität der SolrCloud gibt es bei diesen beiden Möglichkeiten keine Unterschiede; technisch gesehen, bieten externe ZooKeeper die Möglichkeit die Ausfallsicherheit zu […]

Weiterlesen
Blog der SHI GmbH

SurroundQueryParser

Von Johannes Brucher I 28 März 2013
Veröffentlicht in ,

In Solr 4.0 wurde nicht nur die SolrCloud eingeführt. Es gab auch abseits davon zahlreiche Neuerungen, darunter einige QueryParser. In diesem Beitrag wird nun der SurroundQueryParser vorgestellt, der es ermöglicht Wörter, die im Text nah beieinander stehen, zu matchen. Das bedeutet, er kann alternativ zum eDismax QueryParser mit den Parametern pf und ps benutzt werden. Diese beiden Möglichkeiten werden […]

Weiterlesen
Blog der SHI GmbH

Lots Of Cores / Neuer Artikel der Blogserie “Neuerungen rund um Solr”

Von Johannes Brucher I 28 Februar 2013
Veröffentlicht in ,

Solr unterstützt MultiCore SetUps, d.h. eine Solr Instanz kann mehrere SolrCores gleichzeitig verwalten. Dies bietet viel Flexibilität bei der Nutzung von Solr bzw. der SolrCloud. Aktuell gibt es Bestrebungen hier noch ein paar Verbesserungen, vor allem im Cache Management, zu implementieren, denn momentan müssen erst alle Cores beim Start geladen werden bevor die Solr Instanz […]

Weiterlesen
Blog der SHI GmbH

Tipp – Suchen in der Cloud / Neuer Artikel der Blogserie “SolrCloud – Tipps, Tricks und Pitfalls”

Von Johannes Brucher I 18 Februar 2013
Veröffentlicht in ,

Das Suchen in der SolrCloud unterscheidet sich prinzipiell nicht vom Suchen in einer herkömmlichen Solr Instanz. Die eigentlichen Requests sind nahezu identisch; der Core-Name, der Name des RequestHandler sowie Parameter sind weiterhin Bestandteil des Request. Es gibt im Umgang mit der SolrCloud ein paar spezielle Parameter, die die Suche in der Cloud stark beeinflussen können. […]

Weiterlesen
Blog der SHI GmbH

Tipp – clusterstate.json verstehen / Neuer Artikel der Blogserie “SolrCloud – Tipps, Tricks und Pitfalls”

Von Johannes Brucher I 18 Februar 2013
Veröffentlicht in ,

Wenn man mit der SolrCloud arbeitet, stößt man unweigerlich über die clusterstate.json-Datei. Die clusterstate.json-Datei zeigt den aktuellen Status der SolrCloud und wird vom ZooKeeper erstellt und verwaltet. Dieses JSON-Datenformat kann man wunderbar nutzen, um den Status der SolrCloud mittels eigener Analyse- bzw. Monitoring-Tools auszulesen, um, beispielsweise, herauszufinden, ob alle Knoten in der Cloud noch aktiv […]

Weiterlesen

Sprachidentifzierung mit Apache Solr

Von Johannes Brucher I 25 September 2012
Veröffentlicht in ,

Sprachidentifizerung mit Solr zur Indexierungszeit Solr kann Sprachen während der Indexierung erkennen. Dazu benutzt man den langid UpdateRequestProcessor.Hierzu werden zwei Implementierungen angeboten:Das Feature von Tika Sprachen zu identifizieren: https://tika.apache.org/0.10/api/org/apache/tika/language/LanguageIdentifier.htmlLangDetect Sprachidentifizierung basierend auf einer Java Library: https://code.google.com/p/language-detection/ Konfiguration des UpdateRequestProcessors:Der UpdateRequestProcessor wird in der solrconfig.xml konfiguriert. Es muss zumindest ein Feld, welches Grundlage (also Input) der […]

Weiterlesen