Blog der SHI GmbH

Solr für Produktsuche in Online-Shops

Stand heute

Das Thema Suchfunktion in Online-Shops ist nicht gerade neu. Die Shop-Betreiber haben die Bedeutung einer intelligenten und optimierten Produktsuche als „Conversion Engine“ längst erkannt. In der Studie von ibi research , die erst kürzlich veröffentlicht wurde, wird das bestätigt. So kommt die Studie zu dem Ergebnis, dass 70% aller befragten Online-Händler eine optimierte Suche als sehr wichtig erachten würden. Aber nur 16% seien mit der derzeit eingesetzten Suche zufrieden. Zwischen dem Wunsch und Realität klafft also nach wie vor eine bemerkenswert große Lücke. Weiter heißt es: Mehr als der Hälfte der Online-Händler, die derzeit keine optimierte Produktsuche einsetzen, hätten Interesse an einer Suchlösung. Hohe Kosten und die Abhängigkeit vom Hersteller seien dabei jedoch ein großes Hindernis.

Diese Befürchtungen deuten auf die Unkenntnis über die Existenz einer De-facto-Standard Suchtechnologie aus dem Open Source Bereich. Namentlich geht es um „Apache Solr“. Das ist durchaus verwunderlich, denn immerhin haben unter anderem auch sehr große Online-Shops wie z. B. Immobilienscout24, Sears, ebay Kleinanzeigen oder auch Zappos Solr für sich entdeckt und setzen es sehr erfolgreich ein.

Es gibt also gute Gründe, Solr genauer unter die Lupe zu nehmen.

Was ist Solr?

Apache Solr ist ein Suchserver, der fehlertolerante, schnelle und intelligente Produktsuche in Online-Shops ermöglicht. Solr wird unter der sehr liberalen Apache License 2.0 bereit gestellt und kann somit kostenfrei kommerzielle und nicht-kommerziell verwendet, modifiziert und verteilt werden. Solr bringt viele Funktionen mit, die man auch von den etablierten Internetsuchmaschinen kennt. Dazu zählen z. B. Facetten/Filter, Auto-suggest, „Meinten Sie…?“, „Ähnliche Artikel anzeigen…“ und vieles mehr.

Solr stammt ursprünglich aus der Feder von Yonik Seley, der damals für CNET gearbeitet. Später übergabt CNET das Solr Projekt an die Apache Foundation.

Die Apache Foundation ist eine Organisation, die die Entwicklung vieler namhafter Projekte wie z. B. Tomcat, Solr, Apache HTTP Server, Hadoop koordiniert. Inzwischen zählt Solr zu den Top 10 der Apache Foundation und wird täglich mehr als 6000 Mal heruntergeladen. Das ist eine sehr bemerkenswerte Statistik.

Die Gründe für das steigende Solr Momentum dürften so zahlreich wie unterschiedlich sein. Das Verschwinden der etablierten, proprietären Suchtechnologie-Anbieter wie z. B. FAST Search&Transfer, Exalead oder Autonomy dürfte einer davon sein. Ihre Technologien wurden von Firmen wie Microsoft, HP oder Oracle aufgekauft und in eigene Produkte integriert.

Darüber wird Open Source Software mehr und mehr populärer in der Industrie. Das bestätigt eine von Gartner durchgeführte Studie . In dieser Studie nannten die befragten IT-Leiter geringere Kosten, Nutzung der Software auch in weiteren Projekte und Herstellerunabhängigkeit als die wichtigsten Gründe. Hinzu kommen die Verfügbarkeit bezahlbarer Expertise, das Vorhandensein von Support und Erweiterungen der Dritthersteller.

Herausforderungen im eCommerce

Nun was kann Solr konkret für Online-Shops tun? Dazu schauen wir uns zunächst einige Suchtechnologie-nahe Herausforderungen im eCommerce an:

  • Besucher sind ungeduldig und erwarten schnelle und präzise Ergebnisse;
  • Zur Befriedigung der Kundenwünsche wird immer größeres Warensortiment geführt;
  • Exakte Produktbezeichnungen sind unbekannt. Dieses Problem verschärft sich insbesondere bei exotischen Produktnamen;
  • Was ist „in“? Trends müssen rechtzeitig erkannt werden;
  • Hohes Verkehrsaufkommen im Tagesverlauf oder saisonall bedingt;
  • Long Tail der Suchanfragen;
  • Geographische Produktnähe ermitteln.

Nun betrachten wir die Solr Features, die helfen, diese Herausforderungen zu meistern.

Performance

Rekapitulieren wird das klassische Besucherverhalten in einem Online-Shop. Ein Besucher ruft einen Online-Shop auf und nutzt die Suchfunktion, um z. B. einen bestimmten Laufschuh von Nike zu finden. Nun muss die Suchfunktion als Produktverkäufer ihre erste Qualität zeigen: die Ergebnisse im Bruchteil einer Sekunde liefern. Dass Solr dieser Erwartung gerecht wird, demonstrierte ebay Kleinanzeigen auf dem letztjährigen Solr Summit in Deutschland.

Bei ebay Kleinanzeigen sind etwa 2.700.000 aktive Anzeigen verfügbar. Es gibt etwa 22.000.000 Page-Views / Tag und zu Spitzenzeiten etwa 1.730.000 Page-Views / Sekunde. Das ist überaus beachtlich. Solr bewältigt etwa 60.000.000 Anfragen / Tag und 1.500 Anfragen / Sekunde mit einer Antwortzeit von 3 bis 20 ms. Das sind die Werte, die man z. B. von Google kennt.

Relevanz

Bevor die Suchfunktion die Produkte liefert, muss sie ihre zweite Qualität unter Beweis stellen: Die in der Ergebnisliste angezeigten Produkte müssen die Kundenerwartung möglichst genau treffen. Oder anders formuliert: Die relevantesten Ergebnisse müssen zuerst angezeigt werden.

Das Thema Relevant ist keineswegs einfach. Soll heißen, dass es keine Standardrezeptur für die Relevanz gibt. Dass Solr eine ausgetüftelte und im höchsten Maße anpassbare Relevanzberechnung hat, steht außer Zweifel. Die Herausforderung liegt woanders. Damit man eine optimierte Relevanzberechnung hat, müssen nicht nur die eigene Daten (und natürlich das Geschäftsmodell), aber auch die Kunden sehr gut verstanden werden. Dazu führt man üblicherweise Messwerte (Metriken) ein, die kontinuierlich überwacht werden.

Ob die Relevanzberechnung optimal ist, lässt sich durch unterschiedliche Verfahren messen. Z. B. Mean Reciprocal Rank oder Precision at 10. Wichtig dabei ist, dass die Messung kontinuierlich durchgeführt wird und für die Analyse und ggf. Anpassung der Relevanz herangezogen wird.

„Long Tail“ der Suchanfragen

Suchanfragen lassen sich in den „Short Tail“ und „Long Tail“ Bereich unterteilen. Im Short Tail liegen ungenau Suchanfragen (z. B. „Schuhe“). Diese Anfragen machen ohne Zweifel den größten Teil aller Suchanfragen aus. Es ist daher sehr wichtig, den Short Tail sehr gut zu beherrschen und dem Kunden z. B. mittels Facetten / Filter (siehe unten) zu unterstützen.

Im Long Tail liegt hingegen nur ein kleiner Teil aller Suchanfragen. Er ist aber nicht minder interessant. Denn die Suchanfragen des Long Tail Bereichs sind sehr präzise (z. B. „blaue Herrenlaufschuhe von Nike“). D. h., den Kunden, der präzise sucht, muss man auch präzisere Ergebnisse liefern und dadurch zu einer schnelleren Conversion zu kommen. Die Auto-suggest Funktion kann dabei eine großartige Unterstützung leisten.

Facetten / Filter

Solr ist im Standard mit unterschiedlichen Arten von Facetten/Filtern ausgestattet:

  • Facetten über beliebige Felder
  • Facetten über Zeiträume und Zeitintervalle
  • Pivot Facetten
  • Hierarchische Facetten
  • Funktionen
  • Alphabetische oder nummerische Reihenfolge

Und viel, viel mehr

In Solr existieren viele weitere Features, die für einen Einsatz in einem Online-Shop interessant sein könnten:

  • Placements (best bet)
  • Geosuche (spatial search)
  • Ähnliche Artikel anzeigen
  • Meinten Sie…?
  • Synonymlisten / Thesauri
  • Klassifizierung (z. B. mittels Smartlogic Semaphore)
  • Empfehlungen (mittels Mahout)

Fazit

Solr ist in eCommerce längst angekommen. Nicht nur kleine Online-Shops aber auch sehr große setzen auf diese Open Source Technologie mit großem Erfolg. Das liberale Lizenzmodell, die ausgereifte Software, die Offenheit und die Verfügbarkeit bezahlbarer Expertise machen den Einsatz von Solr in Online-Shops sehr attraktiv.

https://www.ecommerce-leitfaden.de/studien/item/die-shop-suche-auf-dem-pruefstand
https://www.gartner.com/it/page.jsp?id=801412
Daniel Wrigley

Daniel Wrigley