Solr SpellChecking

Solr SpellChecking-Komponente: Wie Ihre Nutzer:innen trotz Tippfehlern finden, was sie suchen – und warum die hybride Suche die Zukunft ist

Bei der Nutzung von Suchfunktionen passieren Tippfehler: Nutzer:innen schreiben „Kate“ statt „Karte“ oder vergessen ein Leerzeichen („DeutscheBahn“ statt „Deutsche Bahn“). Damit Suchanfragen trotzdem erfolgreich bleiben, setzt Apache Solr auf verschiedene fehlertolerante Mechanismen – klassisch per SpellChecker, aber in aktuellen Versionen auch über moderne Methoden wie neuronale Suche und hybride Vektorsuche. So vermeiden Sie Nulltreffer-Suchen und Frust – selbst bei komplexen Fehleingaben.

Wann sind Schreibfehler in Solr ein Problem?

Schreibweisen, die von der Indexierung im Solr-Index abweichen (z. B. „donau“ statt „Donau“ oder „LED Lampe“ statt „LED-Lampe“), führen ohne Korrektur zu irrelevanten Treffern oder Null-Ergebnissen. Im Rahmen der Analyse beseitigen Filter (wie LowerCaseFilter oder CharFilter) einige dieser Fälle automatisch – dazu mehr in unserem CharFilter-Blogbeitrag. Die SpellChecking-Komponente war lange Zeit das Standardwerkzeug, um alle weiteren Tippfehler abzufangen und die Fehlertoleranz zu erhöhen. Mit dem Aufkommen der Vektorsuche (auch semantische oder neuronale Suche genannt) und der hybriden Suche (also der Kombination aus Vektorsuche und klassischer lexikalischer Suche) stellen sich viele Solr-User die Frage, ob das klassische Spellchecking überhaupt noch benötigt wird.

Vektorsuche in Solr ab Version 9.0

Mit Solr 9.0 und Solr 10 hat sich das Spielfeld der Suche grundlegend verändert: Moderne Solr-Installationen unterstützen jetzt neuronale Suche durch Vektor-Embeddings (z. B. BERT und andere Modelle). Diese „Neural Search“-Komponenten ermöglichen es, die Suche deutlich toleranter gegenüber der Nutzereingabe zu gestalten und relevante Treffer unabhängig von der exakten Schreibweise oder Formulierung zu erkennen. Besonders stark ist Vektorsuche in den folgenden Bereichen:

  • Beim Verstehen von Synonymen, und zwar ohne dass eine händische Synonympflege nötig ist. Beispiel: „Sofa“ findet „Couch“
  • Beim Erkennen semantischer Ähnlichkeiten. Beispiel: „laptop akku kaputt“ findet „Notebook Batterie defekt“
  • Beim korrekten Interpretieren der Nutzerabsicht. Beispiel: „Ich suche einen weichen Pulli“ findet „Strickpullover aus Kaschmir“

Gerade in diesen Punkten ist die klassische lexikalische Suche schwach. Es gibt zwar die ein oder andere Tuning-Option (z.B. Synonymlisten), doch diese sind meist mühsam umzusetzen und können nicht alle Fälle abdecken. Und auch Spellchecking ist in diesen Bereichen leider chancenlos.

Klassische SpellChecker für klassische Rechtschreib- und Tippfehler

Hat die SpellChecking Komponente also ausgedient? Nein, denn bei den klassischen Rechtschreib- oder Tippfehlern hat sie immer noch die Nase vorn. Auch für ein benutzerfreundliches User Interface (z. B. als „Meinten Sie…?“-Hinweis) oder wenn es sich um eine Domäne handelt, die besonders hohe Präzision erfordert, bewähren sich die klassischen Solr-SpellChecker weiterhin:

  • DirectSolrSpellChecker vergleicht Suchanfragen mit dem Index und schlägt ähnliche Wörter vor.
    • Beispiel: Eingabe „Bretzel“ → Vorschlag „Brezel“, „Brezeln“
  • WordBreakSolrSpellChecker korrigiert (überflüssige) Leerzeichen:
    • Beispiel: „breakingnews“ → Vorschlag „breaking news“
    • Beispiel: „Bahn Card“ → Vorschlag „BahnCard“

Hybride Suche: Best Practice 2026

Unsere Empfehlung für fehlertolerante Suchen in aktuellen Solr-Versionen (9.0/10.0 und aufwärts) ist eindeutig:

  • Toleranz für alternative Formulierungen und Userabsicht: Vektorsuche (bzw. hybride Suche für das Beste beider Welten)
  • Abfangen von Rechtschreib- und Tippfehlern: Klassisches Spellchecking mit SpellChecker Komponente

Hybride Suche in der Praxis

  1. SpellChecker vorschalten, um Rechtschreib- und Tippfehler abzufangen.
  2. Lexikalische Suche deckt exakte und fast-exakte Übereinstimmungen ab.
  3. Vektorsuche (mittels Vektor-Embeddings, z. B. BERT) erlaubt das semantische Matching, auch bei alternativen Formulierungen, Synonymen oder verwandten Konzepten.

Die Kombination von lexikalischer Suche und Vektorsuche bietet eine optimale Balance aus Präzision und semantischem Verständnis.

Wichtige Neuerungen in Solr 10 und geänderte Systemanforderungen

An dieser Stelle seien noch ein paar Servicehinweise genannt, für all diejenigen, die überlegen auf Solr 10 zu migrieren:

  • Solr 10 benötigt Java 21+
    Achten Sie auf die richtige Java-Version in der Umgebung.
  • Der Java Security Manager ist ab Java 24+ deaktiviert
    Dies kann sich auf die Absicherung des Solr-Clusters auswirken – Sicherheitskonzepte müssen gegebenenfalls angepasst werden.
  • Neue Konfigurationsoptionen für Vektorsuche und Embeddings – Dokumentation und Best Practices finden Sie in den offiziellen Release Notes.

Ihr nächster Schritt

Moderne Apache Solr-Suchlösungen setzen auf hybride Suchansätze: lexikalisch + Vektor, ergänzt durch SpellChecking. Wie Sie diese Technologien optimal kombinieren, zeigen wir Ihnen in praxisorientierten Workshops und Schulungen (auch zur Migration auf Solr 9/10 und zu Java 21+). Kontaktieren Sie uns – wir unterstützen Sie beim Aufbau fehlertoleranter und performanter Suchlösungen im Zeitalter der semantischen Suche!

Veraltete SpellChecking-Only-Strategien reichen im Jahr 2026 nicht mehr aus. Setzen Sie auf Vektorsuche für maximale Fehlertoleranz!

Sie haben Fragen oder benötigen Unterstützung? Nehmen Sie gleich Kontakt mit uns auf!

Bianca Schlüter

Bianca Schlüter

...geboren 1994 in Augsburg, studierte Mathematik an der Universität Augsburg mit den Schwerpunkten Statistik und Optimierung. Seit 2020 arbeitet sie als Consultant Search and Analytics bei der SHI. Lieblingsdateiformat: JSON