Maschinen können mit verschiedenen Methoden das Lernen lernen. Daher müssen zunächst wir Menschen eine wichtige Aufgabe erledigen. Wir müssen verstehen, bei welcher Zielsetzung wir den Maschinen wie am besten das Lernen lehren.
Künstliche Intelligenz – wie Maschinen lernen
Das Thema Künstliche Intelligenz fasziniert und beschäftigt die Menschen schon sehr lange. Wie schon in einem früheren Artikel zum Thema „Künstliche Intelligenz – ein Annäherungsversuch“ beschrieben, ist es nicht möglich, eine konkrete Definition für Künstliche Intelligenz zu liefern. Aber lassen Sie uns den Begriff „Künstliche Intelligenz“ dennoch einmal etwas genauer ansehen.
Was ist Künstliche Intelligenz (KI)?
Beim Menschen gibt es unter anderem emotionale Intelligenz, logisch-mathematische Intelligenz oder auch musikalische Intelligenz. Wenn wir aber bei Maschinen von „Intelligenz“ sprechen, meinen wir dann nicht eigentlich „intelligente Methoden“? Und wenn wir von Künstlicher Intelligenz sprechen, meinen wir doch eigentlich eine (künstlich) intelligente Verarbeitung von Daten, oder nicht?
Ein Chat-Bot ist doch eher eine intelligente Methode, die sehr auf ein bestimmtes Thema limitiert ist. Wenn ich bspw. mit einem Chat-Bot auf der Internetpräsenz meines Telefonanbieters in Schriftform kommuniziere, werden Gespräche über das Wetter mit großer Wahrscheinlichkeit sehr wortkarg ausfallen; wohingegen der Bot bei einem Gespräch über den neuesten Smart XL Vertrag wohl kaum zu bremsen sein wird.
Eine ähnliche Limitierung findet sich auch bei der Vorhersage meines Kaufverhaltens. Amazon und Google können mir die besten Vorschläge zu Fahrradutensilien machen, aber auch nur weil ‚andere Leute‘ diese Artikel zusammen mit dem Artikel gekauft haben, welchen ich mir gerade ansehe; oder weil sich meine letzten Suchanfragen auf das Thema ‚Lenkerband für Rennräder‘ beschränkt haben.
Bei Artikeln, für die der Suchmaschinen-Anbieter zu wenig Daten hat, wird das Ergebnis wohl auch eher ernüchternd ausfallen. Das bedeutet aber nicht, dass die ‚intelligente Methode‘ hier schlecht ist.
Aber wie funktioniert diese „KI“ eigentlich?
Um die Funktionsweise von KI zu beleuchten, müssen wir uns mit dem Begriff des Maschinellen Lernens auseinandersetzen – denn wie der Mensch, muss eine Maschine erst einmal lernen, wie die Welt funktioniert.
Überwachtes Lernen (Supervised Learning)
Beim überwachten Lernen bekommt unsere Maschine Paare aus Ein- und Ausgaben, beispielsweise ein Bild eines Verkehrsschildes mit seiner Bedeutung. Die Aufgabe ist es, korrekt zu erkennen, ob es sich um ein Tempolimit oder ein Stopp-Schild handelt.
Das Ziel beim überwachten Lernen ist es, der Maschine durch wiederholtes Training mit unterschiedlichen Ein- und Ausgaben, die Fähigkeit anzutrainieren, Assoziationen zwischen Eingaben und bereits verarbeiteten also ‚gelernten‘ Daten herzustellen. Somit wäre eine Maschine dann auch in der Lage, ihr noch unbekannte Bilder den Schild-Typen „Tempolimit“ bzw. „Stopp-Schild“ zuzuordnen.
Unüberwachtes Lernen (Unsupervised Learning)
Beim unüberwachten Lernen gibt es keine Trainings-Paare aus Ein- und Ausgaben wie beim überwachten Lernen. Die Herausforderung hier ist, die Struktur der Daten bzw. ein statistisches Modell zu finden/erkennen, beispielsweise das Gruppieren von ähnlichen Daten in Form eines „Clusters“ oder die Reduktion der Daten in ein kleineres Sub-Set von gewichteten „Dimensionen“.
Das Ziel beim unüberwachten Lernen ist es, dass die Maschine selbstständig Klassifikatoren erstellt und die Daten anhand dieser einteilt. Nehmen wir Bilder mit roten Kreisen, grünen Dreiecken und blauen Vierecken. Beim unüberwachten Lernen versucht die Maschine selbstständig, die Bilder zu unterscheiden und zu gruppieren. Ob sie eine Einteilung nach Form, Farbe oder einem ganz anderen Kriterium vornimmt, ist uns dabei nicht bekannt. Mit dieser Methode können somit insbesondere unsortierte bzw. ungelabelte Daten unterschieden und sortiert werden.
Bestärkendes Lernen (Reinforcement Learning)
Das bestärkende oder auch verstärkende Lernen beschreibt eine Reihe von Methoden, mit welchen eine Maschine – wie beispielsweise ein autonomes Fahrzeug – selbstständig in einer Umgebung operieren muss. Die Rückmeldung, ob die Entscheidung ‚gut‘ oder ’schlecht‘ war, kommt allerdings erst zeitverzögert.
Bei dem autonomen Fahrzeug könnte das beispielsweise so aussehen, dass das Fahrzeug einen Wert besitzt und mit jeder Kollision verringert sich sein Wert. Ziel des Fahrzeugs ist es nun, eine vorgegebene Strecke zu absolvieren und dabei den eigenen Wert möglichst groß zu halten. Im Optimalfall hat das Fahrzeug am Ende denselben Wert wie am Anfang. Kollidiert das Fahrzeug auf der Strecke mit einem Hindernis, wird das Fahrzeug negativ bestärkt, indem es an Wert verliert. Es lernt dadurch, mit dem nächsten Hindernis dieser Art anders umzugehen. Dies wäre folglich ein Beispiel für negativ ver-/bestärkendes Lernen. Das Ganze funktioniert natürlich auch anders herum indem man eine Maschine ‚belohnt‘, wenn ein gewünschtes Verhalten erreicht wurde.
Verstärkendes Lernen wird beispielsweise auch in Spielen genutzt, wo die Korrektheit der Entscheidung erst am Ende des Spiels getroffen werden kann.
Was haben wir dabei gelernt?
Ob es nun ein Chat-Bot ist, ein autonomes Fahrzeug, oder die intelligente Suche im Internet – jedem dieser ‚intelligenten Systeme‘ liegt mehr oder weniger eine ‚intelligente Methode‘ zu Grunde, mit deren Hilfe es Neues lernt. Denn auch wie der Mensch, muss eine Maschine erst lernen, wie sie an das gewünschte Ziel kommt. Welche Lernmethode für welches System die beste ist, kann man nicht immer pauschal sagen. Oftmals ist eine experimentelle Herangehensweise beim Maschinellen Lernen angebracht. Denn so wie die Maschinen das Lernen erst noch lernen, so lernen wir Menschen erst nach und nach das Lehren der Maschinen.