Compliance in der Finanzbranche

Compliance in der Finanzbranche – Mit Open Source Tools Anrufdaten speichern und durchsuchbar machen

Finanzinstitute sind vom Gesetzgeber verpflichtet, in bestimmten Fällen Telefonate aufzuzeichnen und vorzuhalten. Etwa schreibt die EU-Richtlinie MiFID II die Aufzeichnung von Telefongesprächen im Zuge einer Wertpapierberatung vor. Die Mitschnitte müssen fünf Jahre aufbewahrt werden und für den Fall der Anforderung durch die BaFin schnell auffindbar sein.

Dies bedeutet für die Finanzinstitute, dass sie leistungsfähige und zuverlässige Lösungen benötigen, um diesen Pflichten nachzukommen. Zwei wertvolle Werkzeuge für die Verarbeitung, die Speicherung und das Durchsuchen von Anrufdaten sind die Open Source Tools Apache NiFi und Apache Solr – und das, ohne Lizenzkosten zu verursachen.

Was leisten NiFi und Solr?

NiFi ist ein beliebtes Tool zur Automatisierung des Datenflusses zwischen Softwaresystemen und nutzt das Konzept „Extrahieren, Transformieren, Laden“. Solr ist eine Plattform zum Bauen von Suchlösungen und steckt zum Beispiel hinter der Suche von Adobe, Instagram, Netflix und Salesforce. Die beiden Tools sind in Kombination wie geschaffen für diesen Use Case.

Wie könnte die Umsetzung aussehen?

Zunächst muss man zwischen den eigentlichen Gesprächsmitschnitten und den Anrufmetadaten unterscheiden. Bei den Mitschnitten handelt es sich um Audiodateien, die Metadaten geben beispielsweise Auskunft über das Anrufdatum und die Namen der Gesprächsteilnehmer.

Mit Solr und NiFi können wir insbesondere die Anrufmetadaten gut verarbeiten, speichern und durchsuchbar machen. So kann man sie zunächst mit NiFi von der Quelle, etwa einer Datenbank, abholen. Anschließend können die Daten in NiFi weiterverarbeitet werden, gegebenenfalls angereichert und transformiert. Zuletzt werden die resultierenden Daten beispielsweise im JSON-Format von NiFi an Solr geschickt und dort indexiert.

Die Metadaten sind dann also in Solr gespeichert und können darüber bequem abgerufen und durchsucht werden. Hierbei bietet Solr eine Vielzahl an Möglichkeit, u.a. die Nutzung von Filtern oder Facetten.

Was die Gesprächsinhalte selbst betrifft, sind mehrere Szenarien denkbar. Die Audiodateien selbst können zwar nicht in Solr gespeichert werden, da Solr auf Textdaten ausgelegt ist, sondern müssen in einem anderen System archiviert werden. Die diesbezüglichen Archivierungsmetadaten eines Anrufs, etwa der Archivierungsort oder die ID des Calls im Archiv, könnten jedoch wiederum in Solr gespeichert werden. Diese können dann einer anderen Applikation oder auch Mitarbeitern als „Link“ zwischen den Metadaten und der eigentlichen Audiodatei dienen. 

Liegen die Gesprächsinhalte auch in Textform vor, kann man diese natürlich durchaus gemeinsam mit den anderen Metadaten über NiFi abholen, transformieren und in Solr indexieren. Über Solr kann man in diesem Fall also auch die Gesprächsinhalte selbst abrufen und ganz bequem durchsuchen.

Möchten Sie mehr erfahren?

Bianca Schlüter

Bianca Schlüter

...geboren 1994 in Augsburg, studierte Mathematik an der Universität Augsburg mit den Schwerpunkten Statistik und Optimierung. Seit 2020 arbeitet sie als Consultant Search and Analytics bei der SHI. Lieblingsdateiformat: JSON