Blog der SHI GmbH

Solr Analysekette – Stemming

Von Markus Klose I 09 August 2013
Veröffentlicht in ,

Solr findet Treffer anhand eines Suchbegriffs, wenn sich der Suchbegriff mittels festgelegter Analysekette in einen Term zerlegen oder transformieren lässt, der einem Element des Index entspricht. Die Elemente des Index laufen vor der Indexierung ebenfalls durch einen Analyseprozess durch. Dieser Analyseprozess wird in der Konfigurationsdatei schema.xml für jeden Feldtypen definiert und beinhaltet genau einen Tokenizer und optional […]

Blog der SHI GmbH

Tipp – Solr ZooKeeper CLI / Neuer Artikel der Blogserie “SolrCloud – Tipps, Tricks und Pitfalls”

Von Johannes Brucher I 26 April 2013
Veröffentlicht in ,

Wie bereits in einem vorangegangen Artikel “Tipp – Mehrere Collections in einer SolrCloud verwalten” angedeutet, bietet Solr die Möglichkeit mit dem ZooKeeper über eine im Solr integrierte Command Line API zu kommunizieren. Die Möglichkeiten, die uns hier geboten werden, möchte ich in diesem Beitrag näher beleuchten. Mir der im Solr intergierten ZooKeeper CLI können relevante Operationen abgedeckt […]

PHP Logging mit Apache log4php

Von Daniel Wrigley I 11 April 2013
Veröffentlicht in ,

Für PHP existieren verschiedene Logging Frameworks. Vom eher einfachen kLogger über Zend_Log, welches in das bekannte Zend Framework inkludiert ist, bis zu Apache log4php. In diesem Beitrag möchte ich den Apache log4php kurz vorstellen. Kleiner Projektsteckbrief: Entwicklung: Apache log4php ist ein Teilprojekt vom Apache Logging Services Projects, welches für die Entwicklung und Betreuung zahlreicher bekannter […]

Tipp – Mehrere Collections in einer SolrCloud verwalten

Von Johannes Brucher I 11 April 2013
Veröffentlicht in ,

Die meisten Konfigurationen und Beispiele zur SolrCloud, die man in der Literatur findet, gehen davon aus, dass man pro Solr Instanz nur einen Core hat und somit in der SolrCloud auch nur eine einzige Collection existiert. Dass dies nicht zwingend so sein muss, habe ich bereits in den vergangenen Artikeln angedeutet. Nun möchte ich aufzeigen, […]

Blog der SHI GmbH

Apache Solr in PHP Projekten

Von Johannes Brucher I 10 April 2013
Veröffentlicht in ,

Längst hat der Suchserver Solr auch das PHP Umfeld erobert.Für alle gängigen Content-Management-Systeme wie TYPO3, Drupal oder Joomla! existieren Erweiterungen, um eine komfortable Anbindung des jeweiligen Systems an Solr zu bewerkstelligen. Aber wie ist vorzugehen, wenn in einem PHP Projekt kein CMS-Bolide zum Einsatz kommt und die Solr Anbindung individuell umgesetzt werden muss? Dem Entwickler […]

Externe Zookeeper

Von Johannes Brucher I 28 März 2013
Veröffentlicht in ,

Externe Zookeeper / Neuer Artikel der Blogserie “SolrCloud – Tipps, Tricks und Pitfalls” Wie bereits beschrieben, kann die SolrCloud sowohl mit integriertem ZooKeeper als auch mit einem externen ZooKeeper (Ensemble) betrieben werden. Bei der Funktionalität der SolrCloud gibt es bei diesen beiden Möglichkeiten keine Unterschiede; technisch gesehen, bieten externe ZooKeeper die Möglichkeit die Ausfallsicherheit zu […]

Document Routing in SolrCloud

Von Daniel Wrigley I 28 März 2013
Veröffentlicht in ,

Abstract In Solr 4.1 sind einige Neuerungen und Verbesserungen eingebaut worden.Dieser Beitrag stellt vor, wie man die Platzierung von einem Dokument in einem bestimmten Shard mit Hilfe eines Präfixes in der Dokument-ID steuern kann. Einführung Ab Version 4.1 ist in Solr die Möglichkeit hinzugekommen, indirekt Einfluss darauf zu nehmen, wie bzw. wohin Dokumente indexiert werden.Hierzu […]

Einführung in die Geo-Suche mit Solr

Von Markus Klose I 28 März 2013
Veröffentlicht in ,

Neben der reinen Volltext-Suche wird die geografische Suche immer wichtiger. Viele von den Diensten heutzutage sind ortsgebunden, was auch Sinn macht, denn wenn ich Hunger habe und nach einer guten Pizzeria suche, nützt es mir nichts, wenn die Suche mir ein Lokal in Berlin vorschlägt und ich gerade in Augsburg unterwegs bin.Dieser Artikel befasst sich […]

Blog der SHI GmbH

SurroundQueryParser

Von Johannes Brucher I 28 März 2013
Veröffentlicht in ,

In Solr 4.0 wurde nicht nur die SolrCloud eingeführt. Es gab auch abseits davon zahlreiche Neuerungen, darunter einige QueryParser. In diesem Beitrag wird nun der SurroundQueryParser vorgestellt, der es ermöglicht Wörter, die im Text nah beieinander stehen, zu matchen. Das bedeutet, er kann alternativ zum eDismax QueryParser mit den Parametern pf und ps benutzt werden. Diese beiden Möglichkeiten werden […]

Blog der SHI GmbH

Lots Of Cores / Neuer Artikel der Blogserie “Neuerungen rund um Solr”

Von Johannes Brucher I 28 Februar 2013
Veröffentlicht in ,

Solr unterstützt MultiCore SetUps, d.h. eine Solr Instanz kann mehrere SolrCores gleichzeitig verwalten. Dies bietet viel Flexibilität bei der Nutzung von Solr bzw. der SolrCloud. Aktuell gibt es Bestrebungen hier noch ein paar Verbesserungen, vor allem im Cache Management, zu implementieren, denn momentan müssen erst alle Cores beim Start geladen werden bevor die Solr Instanz […]