Zurück
Kolumne 07/20: KI-Zukunft
Nachvollziehbarkeit als zentraler Erfolgsfaktor
Für künstliche Intelligenz gibt es in der Finanzwirtschaft viele sinnvolle Einsatzgebiete. Das A und O ist für BBL-Kolumnist Scott Zoldi eine transparente Datenbasis. Denn nur so können KI-Modelle selbst transparent und verständlich gemacht werden.

Keine Frage – künstliche Intelligenz (KI) und Machine Learning (ML) erleben aktuell einen echten Hype. Die Möglichkeiten für den Ein­satz sind enorm und die Datensets von heute würden Algorithmik-Experten von früher faszinieren.

Zusätzlich wird die Nutzung von KI und ML auch immer erfolgreicher: Finanz­dienstleister können etwa heute schon auf Konzepte wie Behavior Sorted Lists, Multi-Layer Self-Calibrating Analytics und Collaborative Profiling zurückgreifen, um Kreditkartenbetrug mit maschineller Hilfe zu bekämpfen.

Diese Techniken vergleichen das Nutzungsverhalten eines Kreditkarten­inhabers in Echtzeit mit dem „normalen“ Verhalten ähnlicher Nutzer. Dadurch lassen sich künftige Transaktionen vorhersagen (auch solche, die der Nutzer noch nie getätigt hat), um legitime Bezahlvorgänge nicht fälschlicherweise als Betrug zu deuten.

Aber natürlich gibt es auch kritische Stimmen. Im Alltag geht es unter anderem um die Frage, wie gut künstliche Intelligenz kontrollierbar ist. Denn die Angst ist groß, dass unüberwachte Algorithmen Probleme bereiten.

Von der Ablehnung eines Kreditantrags bis hin zum Abschuss von Atom­raketen ist der Fantasie der Befürchtungen keine Grenze gesetzt. Viel zu selten werden dadurch die wirklichen Herausforderungen und Fragen betrachtet, die KI-Profis jeden Tag zu bewältigen haben. Was sind also die echten Hürden und wie sieht die Zukunft von KI aus, wenn diese gemeistert werden?

Der Data-Scientist-Cowboy

Eines der größten Probleme, das im Bereich KI und ML existiert, nenne ich den „Data-Scientist-Cowboy“: Personen, die KI mehr oder weniger „blind“ nutzen.

Am Ende können sie ihren Vorgesetzten zwar gute Zahlen präsentieren, wissen aber nicht, wie die KI das zustande bringt. Dabei müssen die „Cowboys“ noch nicht einmal etwas Böses im Schilde führen – denn Unkenntnis über die Datenbasis und -nutzung können selbst mit den besten Absichten zu Problemen werden.

Ein Vergleich mit Medizinprodukten veranschaulicht das Problem: Es wäre höchst problematisch, wenn etwa ein Herzschrittmacher auf den Markt geworfen würde und der Hersteller weder weiß, wie und warum er funktioniert, noch das Gerät auf mögliche Fehler geprüft hat.

Warum sollten wir uns also bei künstlicher Intelligenz mit weniger Wis­sen zufriedengeben? Um KI und ML umfassend zu verstehen, müssen wir zwei Bereiche betrachten: die Datenbasis und wie die Algorithmen mit diesen Daten umgehen. Nur mit umfassendem Wissen über die eige­ne KI können Vorurteile abgebaut und das volle Potenzial ausge­schöpft werden.

Ohne Daten keine Modelle

Jedes KI-Modell ist nur so gut wie seine Datenbasis. Sind die Daten fehlerhaft oder in irgendeiner Art verzerrt, spiegelt sich das auch in den Ergebnissen wider, die das Modell liefert.

Der verantwortungsbewusste Umgang mit künstlicher Intelligenz beginnt also schon bei der Datenerhebung beziehungsweise dem Wissen, mit welchen Daten gearbeitet wird. Die am weitesten verbreitete Fehlein­schätzung in Bezug auf Daten ist, dass ein Machine-Learning-Modell besser wird, je mehr Daten man einspeist.

Diese Idee ist aber nicht nur falsch, sondern auch gefährlich. Denn je mehr Daten in einem Modell genutzt werden, desto höher ist die Wahr­scheinlichkeit, zufällige Korrelationen in dem Datenset vorzufinden.

Es wäre möglich, dass zufälligerweise Ihre Kreditausfallquote und der Ladezustand Ihres Handys korrelieren: Es wäre trotzdem befremdlich, wenn ein Bankberater nach Ihrem Handyladezustand fragt, um Ihre Kreditwürdigkeit einzuschätzen – denn einen kausalen Zusammenhang gibt es hier nicht.

Es ist also nicht wichtig, wie viele Daten vorliegen, sondern dass mit den richtigen Daten gearbeitet wird. Die Entscheidung, welche Daten rele­vant sind und wie diese aufbereitet werden, ist fundamental wichtig – und kann das Modell absichtlich oder unabsichtlich so verändern, dass nur die gewünschten Ergebnisse entstehen.

KI und ML sind aber kein Wunschkonzert, sondern sollen realistische Einblicke bieten, um Entscheidungen zu vereinfachen und zu verbes­sern. Hier wird klar ersichtlich, welche Verantwortung einem Mitarbeiter bei der Datenerhebung/-auswahl zukommt. Um am Ende keine bösen Überraschungen zu erleben, ist es nötig, die Datenbasis so transparent wie möglich zu halten. Nur so können auch die Modelle selbst transpa­rent und verständlich gemacht werden.

Modelle erklärbar machen

Mein Grundsatz, wenn es um KI- und ML-Modelle geht, ist: „Explainable First, Predictive Second“. Das heißt: Gibt es zwei Modelle, von denen das eine bessere Vorhersagen trifft, das andere aber besser nachvoll­zieh- und erklärbar ist, werde ich mich immer für das zweite entscheiden.

Denn Machine Learning leidet seit jeher unter einem „Black-Box-Pro­blem“ – also darunter, dass Entscheidungen selbst für die Macher nicht wirklich nachvollziehbar sind. Das ist auch der Grund dafür, dass künstliche Intelligenz teilweise sehr kritisch gesehen wird.

Wer die Entscheidungsfindung seiner Modelle also nachvollziehbar darlegen kann, wird am Ende nicht nur bessere entwickeln, sondern schützt sich auch vor unangebrachter Kritik.

Und spätestens, wenn Menschen durch künstliche Intelligenz zu Schaden kommen oder ungerecht behandelt werden, wird aus der Kritik schnell eine Frage der Haftung.

Damit dieses Problem gar nicht erst aufkommt, gibt es in den meisten Unternehmen Compliance-Richtlinien für KI und ML. Viele Modelle – tatsächlich zwischen 80 und 90 Prozent – schaffen es aber nicht, den kritischen Fragen der Regulierungsbehörden standzuhalten und werden dadurch nach der Entwicklung nicht implementiert, sondern verworfen. Das „Black-Box-Problem“ ist also enorm – ebenso wie das Potenzial von KI und ML, sobald wir diese Hürde überwunden haben.

Blockchain in der Modellentwicklung

Es bleibt die Frage: Wie werden KI und ML erklärbar? Denn selbst das einfachste Machine-Learning-Modell ist im Vergleich zu Scorecard-Konzepten hochkomplex. Ein Modell in der Retrospektive von Grund auf zu analysieren und zu verstehen, erscheint wie eine unlösbare Aufgabe. Schauen wir uns an, wie die Arbeit an einem Modell aussieht, um das zu illustrieren.

Mitarbeiterin Jill extrahiert ein sogenanntes „Latent Feature“ aus dem Modell. Das sind Merkmale, die nicht direkt beobachtet worden sind, sondern im Zusammenspiel der Daten stecken. Ihr Kollege Jack soll daraufhin testen, ob es zwischen den Variablen des „Latent Features“ Verzerrungen gibt.

Verlässt Jack irgendwann das Institut, können wir im schlimmsten Fall nicht mehr nachvollziehen, wie er diesen Test durchgeführt hat. Und spätestens, wenn auch Jill nicht mehr in der Firma arbeitet, können wir nicht einmal mehr sicher sein, ob dieses Merkmal überhaupt überprüft worden ist.

An diesem Punkt kommt die Blockchain ins Spiel. Sie ist nicht nur der Erfolgsgarant für Kryptowährungen, sondern hilft auch dabei, ein quali­tativ hochwertiges Framework für die Entwicklung von Machine-Lear­ning-Modellen zu schaffen.

Dabei lässt sich dieses Konzept auch auf die Auswahl der Datenbasis anwenden und stellt damit das Modell von A bis Z auf eine feste, nach­vollziehbare Basis.

Bei Fico ist die Datenüberprüfung beispielsweise inzwischen fester Bestandteil jeder Modellentwicklung. Die Idee hinter der Blockchain ist so simpel wie genial: Jeder Schritt von Jake und Jill während der Entwicklung wird dabei protokolliert und zu der Übersicht aller vorherigen Schritte hinzugefügt.

Wichtig dabei ist, dass dieses Protokoll keine Übersicht über das finale Produkt ist, sondern den Weg dorthin genau beschreibt. Das bedeutet auch, dass abgelehnte Zwischenschritte genau dargelegt werden müssen. Denn nur so kann auch ohne Jake und Jill der Weg zum fertigen Modell genau nachvollzogen werden.

Aber die Blockchain hilft nicht nur dabei zu verstehen, warum ein Machine-Learning-Modell funktioniert und wie es funktioniert. Es hilft auch dabei, Prozesse in der Modellentwicklung zu standardisieren.

Das Blockchain-Protokoll gibt einen schnellen Überblick darüber, ob Prozessstandards eingehalten worden sind. Also ob beispielsweise bestimmte, unerlässliche Tests durchgeführt worden sind oder wer Freigaben erteilt hat. So wird die Blockchain schon während der Entwicklung zu einem wertvollen Compliance-Werkzeug.

Blockchain und KI – eine Zukunftsverbindung

Aber nicht nur in der Entwicklung von KI und ML ist die Blockchain ein spannendes Konzept. Die Erklärbarkeit von Modellen ist nämlich nur die Basis, um die Möglichkeiten künstlicher Intelligenz vollständig zu nutzen. Unternehmen, die ihre Modelle nachvollziehbar gestalten, steht ein weites Feld innovativer Nutzungsszenarien offen.

Auf Datenebene bietet die Blockchain für KI den Vorteil, dass die eingespeisten Daten unveränderlich, mit Zeitstempel versehen und einfach überprüfbar sind. Zusätzlich steigt durch die dezentrale Natur der Blockchain die Wahrscheinlichkeit, dass mehr Daten geteilt werden.

Diese Vorteile schlagen sich am Ende auch praktisch nieder. Ein Beispiel dafür, wie KI und Blockchain die Zukunft verbessern können sind Kfz-Versicherungen: Übermittelt ein Fahrer die Sensordaten seines Fahrzeugs per Blockchain-Technologie an den Versicherer, kann dieser die Fahrgewohnheiten besser beurteilen und bewerten. Als Gegen­leis­tung für die Datenbereitstellung könnten die Fahrer dann mit niedrigeren Beiträgen belohnt werden.

In einem zweiten Schritt kommt dann die KI ins Spiel. Diese kann die in der Blockchain aufgezeichneten Daten dann auswerten und komplexe Beziehungsgeflechte auswerten. Auf diese Weise steigt die Vorhersagekraft (zum Beispiel für Kollisionen) beachtlich.

Wir dürfen uns also auf die Möglichkeiten freuen, die aus der Kombination von Blockchain und KI entstehen. Vorher müssen wir KI aber erst noch nachvollziehbar machen. Sie wissen ja: „Explainable First, Predictive Second“!

Autor
Scott Zoldi ist Chief Analytics Officer der Firma Fico in San Diego (USA) und verantwortlich für die analytische Entwicklung von Produkt- und Technologielösungen.

Scott Zoldi
– 2. Juli 2020