Was Verlage mit KI erreichen können

Mit Deep Learning den Kunden mehr Fachwissen verfügbar machen

Dr. Eduardo Torres Schumann

... kam 1999 von Sevilla nach München, um Computerlinguistik/Informatik zu studieren. Erste berufliche Erfahrungen im Bereich Suche in biomedizinischen Datenbanken führten ihn dazu, sich während seiner Promotion an der LMU mit dem Aufbau von semantischen Wissensressourcen zu beschäftigen. Die Ergebnisse davon flossen 2009 in die von ihm mitbegründete TopicZoom GmbH, wo er beim Vertrieb semantischer Suchtechnologie viele wertvolle Erfahrungen sammelte. Ab 2011 hat er beim Aufbau einer der führenden Social Media Analytics Plattformen im deutschsprachigen Raum mitgearbeitet und Komponenten zur automatischen Analyse von Tweets und Blogs entwickelt, z.B. zur Erkennung der Tonalität. Lieblings-Dateiformate: .owl, .rdf, .kt, .java, .frq

Teil 3 der Blogserie:

Was Verlage mit KI erreichen können

Kunden von Fachverlagen profitieren umso mehr von einem Premium-Abonnement, wenn sie im Verlagsportal nicht nur unbegrenzt auf Publikationen zugreifen können, sondern ihnen dort auch Recherche-Tools wie eine Suchfunktion zur Verfügung stehen. Damit können sie aus der Fülle der Informationen gezielt Wissen gewinnen, und auf ihre speziellen Fragen erhalten sie schnell und einfach Antworten.

Angetrieben durch Verfahren des Maschinellen Lernens wie Deep Learning ermöglicht Künstliche Intelligenz (KI) mittlerweile, computerbasiert Informationen aus Texten zu erfassen und zu verarbeiten – und das in einer bisher nicht da gewesenen Qualität. Text kann so maschinell „verstanden“ werden und umgekehrt auch aus vorliegenden Informationen automatisch generiert werden.

Angewandt auf eine Sammlung von Fachpublikationen lassen sich mit Deep Learning die „Bedeutung“ von Begriffen und die inhaltlichen Beziehungen regelrecht automatisiert erlernen. Das erlaubt es, das spezielle Wissen über eine Domäne computerbasiert systematisch zu erfassen und zu strukturieren. Damit kann man nicht nur eine bestehende Suchfunktion „intelligenter“ machen, sondern auch ganz neue Formen der Recherche schaffen, die den Zugriff auf Wissen wesentlich erleichtern.

Auf diese Möglichkeiten wollen wir in diesem Beitrag eingehen.

Neural Search: nicht nach Wörtern, sondern nach Bedeutungen suchen

Bei einer Suche mit Hilfe einer klassischen Suchmaschine werden die eingegebenen Suchbegriffe im Index nachgeschlagen, um herauszufinden, in welchen Dokumenten sie wie oft vorkommen. Aus dieser Information, einer einfachen Zahl, wird mit einer vorgegebenen Formel ein Ranking für die Dokumente in der Ergebnisliste berechnet und so über den besten Treffer entschieden. Bei einer klassischen Suchmaschine wird sozusagen die Bedeutung eines Suchbegriffs in einem bestimmten Dokument durch eine einfache Zahl ausgedrückt. Dass da viel von der sprachlichen Information verloren geht, verwundert nicht.

Mit Deep Learning Techniken, die die Bedeutung von einzelnen Wörtern, Sätzen oder gar Absätzen festhalten können, ergeben sich ganz neue Möglichkeiten für die Realisierung von Suchanwendungen. Bei diesem Ansatz, unter dem Begriff Neural Search bekannt, wird die Bedeutung einer Suchanfrage viel präziser als Bedeutungsvektor beschrieben, um anschließend Texte zu durchforsten und so Stellen zu finden, die unabhängig von der genauen Wortwahl genau dieselbe Bedeutung enthalten. So ist es dann möglich, eine Suchanfrage wie „Solarzellen Förderung“ mit einer Textpassage wie „Der Bau von PV-Anlagen wird mit Verordnung XY gefördert“ zusammenzubringen – was in einer klassischen Suchmaschine viel schwieriger und nur durch aufwändige manuelle Konfiguration zu erreichen ist. Dadurch eignet sich der neue Suchansatz sehr gut, um auf die Intension von Suchanfragen einzugehen.

Aber auch bestehende klassische Suchanwendungen können von Deep Learning Techniken profitieren, um Fachwissen zu berücksichtigen:

    • Erkennung von Synonymen und Formvarianten: Mit Hilfe von DL-Verfahren lassen sich synonym verwendete Wörter, Phrasen und Formvarianten in Fachpublikationen erkennen und zusammenführen, sodass Suchanfragen eine bessere Abdeckung in den Ergebnissen erreichen können.
    • Unterstützung der Benutzer bei der Formulierung von Suchanfragen: Die mit KI erfassten fachlichen Zusammenhänge können genutzt werden, um sinnvolle Vorschläge für die Suche zu generieren. So können die Benutzereingaben zu einem vollständigen Fachausdruck ergänzt oder weitere Suchbegriffe angezeigt werden, die im engen Zusammenhang mit der Eingabe stehen.
    • Strukturiert Suchen über Entitäten: Aus den Inhalten lassen sich Objekte einer in dem Bereich relevanten Klasse – beispielsweise Personen oder Programmiersprachen – vorab erfassen und sammeln, um in der Suche den Einstieg über diese Klassen zu ermöglichen oder spezifische Filter für Suchergebnisse anzubieten.

Inhaltsbasierte Empfehlungen erschließen weiteres Wissen

Nutzer von Musik- und Video-Streaming-Diensten sind es gewohnt, dass sie zunächst nach einem bestimmten Stück oder Video suchen, den entsprechenden Inhalt abrufen, um dann anschließend über angezeigte Empfehlungen immer weiter Inhalte zu konsumieren. Am Ende landet man ganz woanders als ursprünglich gedacht, eventuell bei etwas, was man vorher nicht kannte.  

Inhaltsbasierte Empfehlungen sind auch bei fachspezifischen Inhalten ein effektiver Weg, sich einen Überblick zu verschaffen und etwas Neues zu erfahren. Dadurch kann in der Wahrnehmung des Kunden der Nutzen eines unbegrenzten Zugangs zu Wissen gesteigert werden.

KI-Verfahren ermöglichen, unterschiedliche Arten von Empfehlungssystemen zu realisieren, um so auf die möglichen Interessen eines bestimmten Fachpublikums einzugehen. So können beispielsweise nicht nur ähnliche oder ergänzende Inhalte angezeigt werden, sondern auch solche, die Bezug auf einen bestimmten Teil oder Abschnitt einer Publikation nehmen. Das kann zum Beispiel im juristischen Bereich oder auch in der Forschung nützlich sein, um Urteile oder Arbeiten zu finden, die Stellung nehmen zu einem bestimmten Gesetzesparagraphen oder einem Forschungsergebnis.

Question-Answering Systeme beantworten fachliche Fragen

Präzise Fragen lassen sich meistens nur schwer als Suchanfragen formulieren:

Welche Medikamente wurden für Krebs entwickelt?

Welche Verfahren gibt es für die Herstellung von Wasserstoff?

Wer haftet für Schulden im Vereinsrecht?

Question-Answering Systeme interpretieren natürlichsprachlich ausgedrückte Fragen und identifizieren Textpassagen, die Antworten auf die spezifische Frage enthalten. Recherchen können mit Hilfe eines QA-Systems wesentlich effizienter ablaufen.

Bei jedem Smartphone kann man mittlerweile einem QA-Assistenten in natürlicher Sprache eine beliebige Frage stellen. Was in der Breite für das Allgemeinwissen funktioniert, kann erst recht für einen bestimmten Fachbereich in guter Qualität und mit begrenztem Aufwand gemacht werden. Auf Deep-Learning basierende Frameworks ermöglichen die Entwicklung von natürlichsprachlichen Interfaces, die in der Lage sind, fachspezifische Fragen präzise zu interpretieren und zu beantworten.    

QA-Systeme können nicht nur im fachlichen Bereich zu einem Rechercheassistenten weiterentwickelt werden, sondern können auch Kunden im Bereich Customer Service bei ihren nicht fachlichen Fragen unterstützen – und sie so zu zufriedenen Kunden machen.

Deep Learning für automatische Zusammenfassungen

So wie Fragen mit Hilfe von Deep Learning automatisch beantwortet werden können, lässt sich damit auch der komplette Inhalt einer Publikation erfassen, um ihn anschließend automatisiert mit den Kernaussagen zusammenzufassen und als kurzen Text wiederzugeben. Hierbei wird auf generative Deep-Learning-Modelle zurückgegriffen, die in den letzten Jahren für eine deutliche Qualitätsverbesserung von automatisch generieten Zusammenfassungen gesorgt haben.

Anhand einer Zusammenfassung kann ein Nutzer schnell beurteilen, inwiefern eine Publikation für ihn relevant ist. Dadurch werden Recherchen beschleunigt. Automatisch generierte Zusammenfassungen können ebenfalls als Input für Such- oder Empfehlungssysteme dienen, die dann kompaktere Ergebnisse präsentieren und für einen besseren Überblick sorgen.

Wissensgraph: Wissen strukturieren und leicht zugänglich machen

KI bietet also die Möglichkeit, um Fachvokabular und semantische Beziehungen zu erkennen, und kann für einen gezielten Zugriff auf bestimmte Inhalte eingesetzt werden; außerdem lässt sich KI aber auch für die systematische Erfassung und Ablage von Wissen nutzen. Aus Textsammlungen können bestimmte Beziehungen automatisiert extrahiert werden, um so beispielsweise aus Forschungsberichten eine Tabelle mit Genmutationen aufzubauen, die in Verdacht stehen, bestimmte Krankheiten zu verursachen.

Komplexe Beziehungen zwischen Begriffen und Entitäten können ebenfalls automatisiert aus Fachliteratur gewonnen und in Form eines sogenannten Wissensgraphs systematisiert werden. In einem solchen Netz beschreiben Knoten relevante Entitäten, und Kanten bilden potenziell unterschiedliche Beziehungen zwischen diesen Entitäten ab, sodass man sich leicht einen Überblick über wichtige Zusammenhänge eines Bereichs verschaffen kann. Ein solches Netz kann dann den Zugriff auf Informationen einer Domäne wesentlich vereinfachen, indem es für die Navigation in einer Dokumentsammlung genutzt oder mit der Suchfunktion kombiniert wird.

Ein Wissensgraph kann aber auch verstecktes Wissen sichtbar machen. Daher bauen manche Unternehmen Wissensnetze auf, um das eigene Know-how zu sichern und sich einen strategischen Vorteil zu verschaffen.

Fazit

KI-Verfahren wie Deep Learning stellen ein allgemein einsetzbares Werkzeug dar, das vielfältige Anwendungen für den Zugriff und den Umgang mit Inhalten ermöglicht. Nicht nur bei der Verarbeitung von Bildern sondern von natürlichsprachlichen Daten wie Texten wurde ein Stand der Technik erreicht, der es möglich macht, Wissen mit einer bisher nicht erreichten Qualität zu erfassen und leicht zugänglich zur Verfügung zu stellen.

Fachverlage können damit auf die speziellen Bedürfnisse ihrer Kunden eingehen und ihnen maßgeschneiderte Recherche-Tools anbieten, und so den Nutzen ihrer Produkte und Dienstleitungen steigern.

Möchten Sie weitere KI Use Cases kennenlernen, um den Content Ihres Verlages effizienter zu vermarkten?
Posted in ,