Die Nadel im Nadelhaufen finden

02 Juni 2020

Die Nadel im Nadelhaufen finden – mit Hilfe von Künstlicher Intelligenz

Verschiedene Methoden der Künstlichen Intelligenz (KI) ermöglichen es den Finanzdienstleistern, bei komplexen Transaktionen kriminelle Aktivitäten wie beispielsweise Geldwäsche oder auch die Finanzierung von Terrorismus zu erkennen. Effektiv und effizient kann dies allerdings nur dann erfolgen, wenn nicht – wie so häufig – nach dem „Maslows-Hammer“-Prinzip vorgegangen wird. Es sind Experten mit fachspezifischem Wissen gefragt, die auch praktische Erfahrungen haben, um die richtige KI-Methode schnell einer akuten Problemklasse zuzuordnen und dort mit chirurgischer Präzision lösungsorientiert einzusetzen.

Was ist Künstliche Intelligenz?

Den Verantwortlichen in den Finanzinstituten erscheint KI vermutlich als eine Art „Corpus Hermeticum“. Das liegt vor allem am Fachgebiet der KI, die sich derzeit in einem permanenten Definitionsprozess befindet. Selbst KI-Forscher sind momentan nicht in der Lage, eine allgemeingültige Definition zu liefern. Wir wollen daher zunächst etwas Licht ins Dunkel bringen:

KI lässt sich in eine allgemeine (starke) Künstliche Intelligenz und eine spezielle (schwache) Künstliche Intelligenz unterteilen. Im weiteren Verlauf werden wir „schwache“ KI griffiger als „angewandte“ KI bezeichnen. Während es sich bei der starken KI um eine visionäre Disziplin handelt, die die gleichen intellektuellen und kognitiven Fähigkeiten wie die des Menschen erlangen oder sogar übertreffen möchte, konzentriert sich die angewandte KI ganz pragmatisch auf konkrete Probleme – beispielsweise auf das Erkennen von Mustern verschiedenster Art. Das ist nützlich und gewinnbringend. Wir werden relevante Methoden der angewandten KI, die zur Bekämpfung von Finanzkriminalität von entscheidender Bedeutung sind, später genauer skizzieren.

Zunächst aber noch zum Begriff „Machine Learning (ML)“. Dabei handelt es sich um eine Disziplin, die der angewandten Künstlichen Intelligenz zuzuordnen ist. Sie befasst sich damit, dass Computer Dinge lernen, für die sie nicht explizit programmiert worden sind. Mit anderen Worten: Maschinen beobachten ein Muster und versuchen, es anschließend selbständig zu verallgemeinern. Die Disziplin des Machine Learning lässt sich ihrerseits wiederum in mindestens zwei verschiedene Subtypen unterteilen:

Supervised Learning transformiert Datenmengen

Beim überwachten Lernen (Supervised Learning) handelt es sich um ein Verfahren, das eine gegebene Datenmenge in eine andere bereits bekannte Datenmenge überführt. Anders formuliert: Man verwendet etwas, was man weiß, als Input, um dies in etwas zu transformieren, was man wissen möchte. Folgendes Beispiel kann das veranschaulichen, indem es sehr vereinfacht ist:

Sie verfügen über eine Datenmenge namens Geldwäscheaktionen am Montag, in der die Geldwäscheaktionen der letzten zehn Jahre aufgezeichnet sind, und eine zweite, die Geldwäscheaktionen an den Dienstagen desselben Zeitraums enthält; ein überwachter Lernalgorithmus wäre dann in der Lage, aus diesen beiden Datenmengen eine weitere vorauszusagen – nämlich die Geldwäscheaktionen für einen beliebigen Dienstag in der Zukunft. Um dieses Ziel zu erreichen, müssen zwei Voraussetzungen gegeben sein: Der überwachte Lernalgorithmus muss vorab mit den Daten aus der Vergangenheit trainiert worden sein; und die Geldwäscheaktionen des direkt vorhergehenden Montags müssen vorliegen.

Unsupervised Learning gruppiert Daten

Anders als ein überwachter Lernalgorithmus transformiert der unüberwachte Lernalgorithmus vorliegende Datenmengen in unbekannte Datenmengen. Man spricht in diesem Zusammenhang auch von Clustering. Hier wird also keine bestimmte Antwort erwartet, die vom Trainingsmodell lediglich reproduziert werden soll. Stattdessen wird nach Mustern in der Eingabe-Datenmenge gesucht, die anschließend gruppiert in Form einer Ergebnismenge zurückgeliefert werden. Es wird also eine Menge von Datenpunkten in eine Sequenz von sogenannten Clusterbezeichnungen umgewandelt.

Wenn beispielsweise zehn Gruppen erkannt werden, wird eine Aufteilung in zehn Cluster vorgenommen und jeder Cluster erhält als Bezeichner üblicherweise einen numerischen Wert (z.B. 1 bis 10). Im Anschluss daran wird jedem Datenpunkt der numerische Wert seines entsprechenden Clusters zugeordnet. Es entsteht eine Sequenz von Clusterbezeichnungen. Wichtig zu wissen ist dabei, dass der Lernalgorithmus keine Aussage über die inhaltliche Bedeutung der erkannten Cluster trifft. Er vergibt nur Nummern. Die Semantik muss letztendlich intellektuell durch einen Menschen erschlossen werden. Treten neue unbekannte Muster auf, ist es sehr wahrscheinlich, dass man auf die gesuchte Nadel im Nadelhaufen gestoßen ist (fraud detection).

Präzise Analyse von Transaktionsdaten

Verfahren des ML analysieren enorme Mengen an Transaktionsdaten automatisiert und zeichnen verdächtige Aktionen mit aussagekräftigen Risikobewertungen aus. In Echtzeit. Die Lernverfahren identifizieren somit nicht nur Muster, die den menschlichen Anti Financial Crime-Analysten verborgen bleiben, sondern sie erzielen auch eine weitaus höhere Erkennungsrate bei gleichzeitig niedrigeren Fehlalarmen. Hierdurch sind Banken in der Lage, nicht nur die Betriebskosten bedeutend zu senken, sondern auch die Effizienz und Sicherheit zu steigern. Neben den Daten, die sich nur auf die reinen Transaktionen beziehen, sollten unserer Ansicht nach auch weitere Informationen zum Kontext mit in die Analyse einbezogen werden: zum Beispiel der Standort des Akteurs, das verwendete Device und so weiter. Hierdurch lässt sich ein noch genaueres Bild zum vorliegenden Geschehen gewinnen.

Ausblick

ML erfährt bereits seit den 2000er Jahren unter anderem durch die rasante Entwicklung der Digitalen Transformation einen bedeutenden Aufschwung, und für diese Entwicklung ist noch längst kein Ende in Sicht. Dieser positive Trend wird sich vermutlich in den kommenden Jahren stabil fortsetzen.

Nicht nur Unternehmen, sondern auch Banken und banknahe Finanzdienstleister werden daher Lernalgorithmen zunehmend unterstützend zu Erkennung von Finanzkriminalität einsetzen müssen, um schnell, umfassend und präzise entscheiden zu können, welche Transaktionen verdächtig sind und welche nicht. Mehr als nur empfehlenswert ist es daher für jeden Finanzdienstleister, in den genannten ML-Bereichen Kompetenzen zeitnah aufzubauen und dabei stetig weiterzuentwickeln.

Die praxiserprobten KI-Experten der SHI unterstützen auch Sie gerne bei der Pilotierung entsprechender Projekte oder mit einem Proof of Concept.

Kontaktieren Sie uns jetzt!

Die Nadel im Nadelhaufen finden

Die Nadel im Nadelhaufen finden – mit Hilfe von Künstlicher Intelligenz

Was ist Künstliche Intelligenz?

Supervised Learning transformiert Datenmengen

Unsupervised Learning gruppiert Daten

Präzise Analyse von Transaktionsdaten

Ausblick

Die praxiserprobten KI-Experten der SHI unterstützen auch Sie gerne bei der Pilotierung entsprechender Projekte oder mit einem Proof of Concept.

Rainer Gnan

Das könnte Sie auch interessieren:

Solr SpellChecking-Komponente: Wie Ihre Nutzer:innen trotz Tippfehlern finden, was sie suchen – und warum die hybride Suche die Zukunft ist

Die nächste Generation der Datenintegration: Warum Apache NiFi 2 Ihr nächstes ETL-Tool sein sollte

Bavaria, Advancements in SEarch Development (BASED) Meetup: Rückblick und Highlights