Zurück
BBL_Maschinelles Lernen
Was die Maschine verbessert
Die Effizienz der Kreditvergabe lässt sich mit technischer Hilfe steigern. Ein Beispiel aus Indien zeigt, wie das funktionieren kann.

Technologiefortschritte bei Rechenleistung, Kryptografie, großen Datenmengen und künstlicher Intelligenz sorgen zusammen mit leichterem mobilen Zugang sowie erhöhter Internet-Geschwindigkeit und Bandbreite für mehr Finanzinnovationen.

Dazu gehören neue Ansätze bei der Kreditvergabe, im Zahlungsverkehr, in der Anlageberatung, bei Versicherungen und ganz allgemein die Art und Weise, wie Gelder vom Sparer beziehungsweise Investor zum Kreditnehmer geleitet werden. Das gilt nicht nur für die Industrieländer, sondern auch für die Schwellen- und Entwicklungsländer.

Indien hat in den letzten Jahren große Fortschritte beim Einsatz technologischer Finanzinnovationen gemacht (s. BBL-Beitrag 9/2020: Der Kipppunkt). Einsetzen lassen sich etwa Algorithmen des maschinellen Lernens (ML), um Kreditentscheidungen zu verbessern. ML ist dabei ein Oberbegriff für künstlich generiertes Wissen. Ein künstliches System lernt aus Beispielen und kann diese nach Beendigung der Lernphase verallgemeinern.

Dazu bauen Algorithmen beim ML ein statistisches Modell auf, das auf Trainingsdaten beruht (s. Abb. 1). Doch wie funktioniert das genau?

Eine aktuelle indische Studie (Fintech for the Poor: Financial Intermediation Without Discrimination, Download am Ende des Beitrags oder hier) geht unter anderem der Frage nach, ob ML-Algorithmen Kreditsachbearbeiter damit unterstützen können, den Zugang zu formalen Krediten für sozial Benachteiligte zu verbessern. Generell scheint der Einsatz von ML bei der Kreditvergabe sinnvoll.

Die Merkmale des Kreditantrags sind die Eingangsvariablen. Als Ergebnisvariable fungiert die Leistung der Kreditrückzahlung. Doch leider stehen in Schwellen- und Entwicklungsländern nicht genügend harte Informationen in ausreichender Qualität zur Verfügung.

Harte Informationen können von Dritten verifiziert werden. Sie umfassen Informationen wie:

  • Adresse des Kreditnehmers
  • Zusammensetzung und Größe der Familie
  • Beruf
  • Zahlungshistorie bei Darlehen.

Dem Kreditsachbearbeiter kommt daher eine besondere Rolle zu, hängt es doch von seiner Erfahrung und seinem lokalen Wissen ab, ob der Kreditnehmer in der Lage ist, den Kredit zurückzuzahlen.

Weiche Informationen können nicht ohne weiteres von Dritten verifiziert werden und sind daher nicht ohne weiteres übertragbar.

Hier finden Sie weitere Beiträge aus den Betriebswirtschaftlichen Blättern (BBL)

⇒ Infotipp: Setzen Sie auf diesen Link ein Bookmark - und Sie haben jederzeit einen Überblick über die Betriebswirtschaftlichen Blätter.

Eine Maschine verwendet nur harte Informationen. Sie schätzt daher die Kreditwürdigkeit wahrscheinlich mit einem gewissen Fehler, denn ihr fehlen die weichen Informationen. Die Schlüsselfrage ist, ob die Verarbeitung harter Informationen durch die Maschine ausreicht, um den allgemeinen Informationsvorsprung der Kreditsachbearbeiter auszugleichen.

Der Autor der Studie, Prasanna Tantri, verwendet etwa 17.000 Kreditanträge von Kreditnehmern einer indischen Bank. Die Kunden sind in 196 Dörfern bzw. Städten in zehn indischen Bundesstaaten ansässig. Die Kreditantragsteller sind allesamt Personen, die über ein geringes Einkommen verfügen.

Die meisten Antragsteller sind entweder Landwirte oder besitzen Kleinstunternehmen wie Einzelhandelsgeschäfte, kleine Bekleidungsfabriken oder Lebensmittelverarbeitungsbetriebe. Die meisten Kreditnehmer können kaum formale Dokumente vorweisen. Über die im Kreditantrag offengelegten Informationen hinaus werden auch Daten über die letztendliche Kreditentscheidung und die Rückzahlungen verwendet.

Hervorzuheben ist, dass die indische Bank mit sogenannten Geschäftskorrespondenten (BCs) in ländlichen Gebieten zusammenarbeitet. BCs sind Einzelhändler und haben einen festen Sitz an einem Ort.

Sie werden von Banken beauftragt, grundlegende Bankdienstleistungen an Orten anzubieten, die nicht von Bankfilialen bedient werden. Solche Dienstleistungen bestehen darin, Bankkonten zu eröffnen, Einlagen entgegenzunehmen, Gelder zu überweisen oder Kleinkredite auszuzahlen. Sie nehmen auch die Kreditdokumente entgegen, die zur Bearbeitung an die Bank geschickt werden. Die Bank stellt die notwendige technische Infrastruktur für den Betrieb der BCs zur Verfügung. Die BCs erhalten Gebühren für die Anzahl erfolgreicher Transaktionen.

Da es für die Banken schwierig ist, mit der großen Anzahl der BCs umzugehen, arbeiten sie mit Aggregatoren zusammen, die BCs im Auftrag der Banken rekrutieren und verwalten. Die für die Studie verwendeten Daten kommen auf Kreditantragsebene von einem solchen BC-Aggregator. Er ist in den zehn indischen Bundesstaaten aktiv.

Für Kreditanträge dienen die BCs als Kreditsammelstellen. Ein bestimmter Kreditsachbearbeiter der Bank bearbeitet die Kreditanträge und entscheidet über sie. Der Kreditsachbearbeiter besucht die BCs vor Ort und spricht mit den Kreditantragstellern.

Manchmal besuchen die Kreditsachbearbeiter den Arbeitsplatz des Kreditantragstellers und fragen auch nach Referenzen. Daraus lässt sich schließen, dass die Kreditsachbearbeiter sowohl harte als auch weiche Informationen über die Kreditantragsteller sammeln. Außerdem holen sie auch Informationen von den BCs ein.

Der Datensatz kombiniert Informationen über Kreditanträge und kreditbezogene Transaktionen. Zudem liegen Informationen über Beruf, Alter, Geschlecht, Einzel- und Familieneinkommen, Postanschrift vor.

Schließlich sind die Höhe des beantragten Kreditbetrags, Sicherheiteninformationen sowie das Datum des Antrags auf Kreditantragsebene wichtig. Der Datensatz erstreckt sich über einen Zeitraum von Januar 2017 bis Februar 2020. Das schließt durchschnittlich zwölf monatliche Rückzahlungsbeobachtungen für jedes Darlehen ein.

Die Daten liegen auf der Ebene der Kreditnehmermonate vor. Dabei ist entscheidend, ob ein Kreditnehmer jemals mit dem betrachteten Kredit in Verzug geraten ist. Insofern sind die Informationen über das Fälligkeitsdatum der monatlichen Raten, den Ratenbetrag, den überfälligen Betrag, den Gesamtkreditbetrag und den ausstehenden Kreditbetrag zum Fälligkeitsdatum jeder Rate erforderlich.

Der durchschnittliche Kreditbetrag liegt bei etwa 2.000 US-amerikanischen Dollar. Der durchschnittliche Zinssatz beträgt 13,7 Prozent. Das sind fast 6,5 Prozent über dem risikofreien Zinssatz. Die Kredite werden zu rein kommerziellen Bedingungen ohne jegliche Subventionierung durch die öffentliche Hand vergeben.
Es ist wichtig, die Merkmale der Kreditanträge von genehmigten und abgelehnten Fällen zu vergleichen. Dabei kann man festzustellen, dass sich genehmigte und abgelehnte Fälle in beobachtbaren Merkmalen wie Wert der Vermögenswerte bzw. Einkommen unterscheiden.

Funktionsweise des ML-Algorithmus

Für die ML-Übung werden die Daten auf Kreditnehmerebene organisiert. Von den 17.000 Anträgen können etwa 11.000 Beobachtungen verwendet werden. Dies sind die Kredite, die bewilligt, rund 6.000 abgelehnt worden.

In der Studie wird der XGBoost-Algorithmus (eine Open-Source-Software-Bibliothek für überwachtes ML mit dem sogenannten Baumalgorithmus mit Gradient Boosting) eingesetzt. Es handelt sich um ein Instrument zur Klassifikation (s. Abb. 2).

Wie bei jedem ML-Algorithmus besteht das Ziel darin, eine funktionale Beziehung zwischen Eingaben und Ausgaben zu schätzen. Die Eingaben bestehen im dargestellten Fall aus verschiedenen Kreditantragsmerkmalen.

Die Ergebnisvariable, die als Teil des überwachten Lernens in den Algorithmus eingespeist wird, ist eine Dummy-Variable, die den Wert 1 annimmt, wenn der betrachtete Kredit ausfällt, und ansonsten 0. Die vorhergesagte Variable kann als die Wahrscheinlichkeit des Kreditausfalls interpretiert werden.

Normalerweise folgen ML-Algorithmen einer 80:20-Regel, bei der der Algorithmus auf 80 Prozent der Daten trainiert und auf den restlichen 20 Prozent getestet wird. Die Daten werden zufällig ausgewählt.

Die Trainingsstichprobe besteht also grob aus 9.000 und die Teststichprobe aus 2.000 Beobachtungen auf Kreditnehmerebene. Es werden mehr als 60 Variablen sowie fixe Effekte des Kreditsachbearbeiters und des Standorts als Inputs für das Training verwendet.

Der Baumalgorithmus arbeitet so, dass die Eingabevariablen in verschiedene binäre Klassen aufgeteilt werden. Zuerst könnte danach aufgeteilt werden, ob der Kreditantragsteller ein Landwirt ist oder nicht. Die untergeordneten Aufteilungen können auf anderen Variablen wie Einkommen, Alter und anderen Merkmalen basieren.

Noch eine Anmerkung zum Gradient Boosting: Boosting ist ein Verfahren, um Vorhersagen zu verbessern, die der Algorithmus in den ersten Runden gemacht hat.

Er berechnet die Verlustfunktion. Dabei wird versucht, den Verlust zu minimieren, indem er den Beobachtungen, die am meisten falsch vorhergesagt worden sind, jeweils ein höheres Gewicht gibt.

Der Algorithmus erstellt auf diese Weise neue Modelle und hört auf, wenn sich die Vorhersagegenauigkeit nicht mehr weiter verbessern lässt. Die Gradient-Boosting-Technik verwendet einen Gradientenabstiegsalgorithmus, um den Verlust beim Hinzufügen neuer Modelle zu minimieren.

Einsatz von Testverfahren

Bevor nun der Algorithmus mit den Ergebnissen des Kreditsachbearbeiter verglichen wird, testet man die Qualität der Vorhersagen. Dieser Schritt ist typisch für jede ML-Übung.

Grundlage ist dabei eine häufig verwendete Metrik, die als Fläche unter der sogenannten ROC-Kurve bekannt ist. ROC steht für „Receiver Operating Characteristic“. Vereinfacht gesagt, visualiert die ROC-Kurve eine Matrix für jeden Schwellenwert.

Die ROC-Kurve zeigt eine falsch positive Rate auf der x-Achse. Auf der y-Achse ist die echte positive Rate zu sehen. Das ist der Teil der Klasse, der korrekt klassifiziert worden ist.

Das Verhältnis wird bei verschiedenen Schwellenwerten für die Klassifizierung des Wahrscheinlichkeits-Scores als Erfolg oder Misserfolg abgetragen. Nehmen wir einen Schwellenwert von 50 Prozent. Bei diesem Wert werden 80 Prozent der tatsächlichen säumigen Zahler als säumige Zahler und zehn Prozent der tatsächlichen Nicht-Säumigen als säumige Zahler klassifiziert, dann wird das Ergebnis als zehn Prozent auf der y-Achse und 80 Prozent auf der x-Achse festgehalten.

Die Fläche unter der ROC-Kurve ist die Metrik, die zum Testen der Genauigkeit des Modells verwendet wird. AUC (Area Under the ROC Curve) repräsentiert die Fläche unter der ROC-Kurve.

Je höher die AUC, desto besser kann das Modell Instanzen korrekt klassifizieren. Idealerweise sollte sich die ROC-Kurve bis zur oberen linken Ecke erstrecken. Der AUC-Wert wäre in diesem Szenario Eins.

Eine zufällige Vermutung führt zu einer ROC-Kurve von 45 Grad und einer AUC von 50 Prozent (s. Abb. 3). Im vorliegenden Fall beträgt die AUC fast 72 Prozent und liegt damit über den üblichen Schwellenwerten.

Um das Modell zu bewerten, wird das tatsächliche mit dem vorhergesagten Ergebnis verglichen. Abbildung 4 zeigt den Vergleich. Die Kalibrierungskurve stellt die vom ML-Algorithmus generierten Risikowerte auf der horizontalen Achse und das vorhergesagte Ausfallrisiko auf der vertikalen Achse dar.

Der Test erfolgt mit den zirka 2.000 Kreditnehmern „out of sample“. Wie in der Abbildung 4 auf der linken Seite zu sehen ist, führt ein höheres vorhergesagtes Risiko zu einem höheren Ausfall. Das Ergebnis zeigt, dass der ML-Algorithmus in die richtige Richtung arbeitet.

Anschließend wird getestet, ob die Bewilligungsquote der Kreditsachbearbeiter mit den von der Maschine generierten Risikowerten zusammenhängt. Wenn die letztgenannten Risikowerte und die Risikobewertung durch die Sachbearbeiter in die gleiche Richtung weisen, dann gibt es eine negative Beziehung zwischen dem maschinell generierten Risikowert und der Bewilligungsquote.

In Abbildung 4 ist auf der rechten Seite eine Kalibrierungskurve dargestellt, die den Zusammenhang zwischen den von der Maschine vorhergesagten Risikowerten und der Bewilligungsquote durch den Kreditsachbearbeiter aufzeigt. Die Risikowerte sind auf der horizontalen Achse und die Bewilligungsquoten auf der vertikalen Achse abgetragen.

Eine eindeutige negative Beziehung zwischen den Risikowerten und der Bewilligungsquote ist nicht zu erkennen. Die Kreditsachbearbeiter scheinen es schwer zu haben, risikoreiche Kreditnehmer zu identifizieren.

Die Bewilligungsquoten sind sowohl bei Kreditnehmern mit niedrigem als auch mit hohem Risiko hoch. Das Risikomodell, das die Kreditsachbearbeiter anwenden, unterscheidet sich also deutlich von der Einschätzung des ML-Programms.

Nach dem Training und Testen des ML-Algorithmus ist der nächste Schritt, die Leistung des Algorithmus mit der der Kreditsachbearbeiter zu vergleichen. Zu Beginn ist es wichtig, die zu optimierende Zielfunktion klar zu definieren.

Die Fragestellung wird aus Sicht der Bank gestellt. Deren Ziel ist es, die Ausfälle bei einer bestimmten Höhe des verliehenen Kreditbetrags zu minimieren. Alternativ kann die Bank die Ausfälle minimieren und das Ziel verfolgen, die Kreditbewilligungsquote auf konstantem Niveau zu halten. Die Idee ist hier, eine maximale Anzahl von Kreditnehmern zu bedienen.

Ergebnisse des Tests

Mit Hilfe des ML-Algorithmus können 60 Prozent mehr Kredite bei einer angenommenen Ausfallrate der Kreditnehmer vergeben kann. Gleichzeitig kann gezeigt werden, dass bei Anwendung des Algorithmus eine 33 Prozent niedrigere Ausfallrate erreicht wird, wenn eine konstante Bewilligungsquote unterstellt wird.

Der Informationsvorteil, den die Kreditsachbearbeiter aufgrund weicher Informationen erlangen, reicht nicht aus, um den Fehler gegenüber der Maschine auszugleichen.

Zu ergänzen ist, dass der ML-Algorithmus die Dynamik der Kreditverga­be im Monatsverlauf berücksichtigt. So wird etwa unterstellt, dass der Kreditsachbearbeiter zum Monatsende eine nachsichtigere Kreditvergabe vornimmt.

Um seine individuellen Ziele zu erreichen, kommt es also zu risikoreicheren Kreditzusagen. Drei unterschiedliche Definitionen von Bewilligungsquoten sind im ML-Algorithmus erfasst. Dazu kommen fünf Ausfalldefinitionen. So zeichnet sich dann ein „nachsichtiges“ Regime durch hohe Bewilligungs- und Ausfallraten aus.  

Man könnte vielleicht skeptisch sein, ob die Datenmenge mit knapp 11.000 Kreditnehmern nicht zu klein ist. Oder es ließe sich einwenden, dass die Ergebnisse in größeren Stichproben nicht zutreffen oder der Stichprobenumfang für die Verwendung der XGBoost-Technik zu gering ist.

Diese Skepsis ist unberechtigt. Auch bei größeren Stichproben funktioniert die Technik sehr gut und die Ergebnisse können bestätigt werden. Der XGBoost-Algorithmus schneidet besser ab als andere einfachere Algorithmen.

Auch für den Kontext der Schwellen- und Entwicklungsländer ist wichtig, dass ein solcher ML-Algorithmus nicht dazu führen darf, dass bestimmte Kreditnehmergruppen von der Kreditvergabe ausgeschlossen werden.

In Indien gibt es beispielsweise öffentliche Programme, die von den Banken verlangen, gezielt Kreditnehmer in bestimmten Branchen zu kreditieren.

Im vorgestellten Fall kann gezeigt werden, dass die Bank die Anforderung eines vorrangigen Sektors während des Stichprobenzeitraums problemlos erfüllt hat. Der ML-Algorithmus schränkt die Kreditvergabe also nicht derart ein, dass bestimmte Ziele nicht mehr erreicht werden. Oder anders formuliert: Die Effizienz bleibt auch dann erhalten, wenn der Algorithmus explizit daran gehindert wird, benachteiligte soziale Schichten bei der Kreditvergabe zu beschränken.

Es muss klar sein, wie und wo ein ML-Tool eingesetzt werden kann und vor allem, wo seine Grenzen liegen. Der Zweck des vorgestellten Falls ist es, die Entscheidungsfindung von Menschen mit und ohne das ML-Tool zu vergleichen.

Es geht nicht darum, den Menschen zu ersetzen. Die Leistung eines Kredits hängt sowohl vom Screening als auch von der Überwachung durch die Kreditsachbearbeiter ab.

Ein ML-Tool kann etwa den Teil des Screenings übernehmen. Es ist wohl davon auszugehen, dass der Überwachungsaufwand des Sachbearbeiters auch bei Einsatz einer Maschine gleichbleibt.

Mit anderen Worten: Ein Argument für die Überlegenheit von Maschinen gegenüber Menschen im Zusammenhang mit Krediten könnte nur in Fällen vorgebracht werden, in denen der Überwachungsaufwand gleich Null ist.

Jenseits dieses außergewöhnlichen Falls kann der ML-Algorithmus ein praktisches Werkzeug sein, das die Effizienz der Kreditsachbearbeiter verbessern kann.

Fazit

ML-Algorithmen können verwendet werden, um Kreditsachbearbeitern bei der Verbesserung des Zugangs zu formalen Krediten für Zielgruppen in unteren Einkommensschichten zu helfen. Eine Bewilligung eines Kreditantrags geht immer mit der Frage einher, ob der Kreditnehmer seinen Kredit in der Zukunft zurückzahlen kann.

Die Merkmale des Kreditantrags bilden die Inputvariablen und die Rückzahlung der Kredite sind Ergebnisvariable. Um den Sachverhalt zu lösen, lassen sich ML-Techniken sinnvoll einsetzen.

Aber Kreditsachbearbeiter verfügen über weiche Informationen, die sie bei der Kreditvergabe verwenden (personal-based lending). Der Einsatz weicher Informationen, auf die eine Maschine nicht trainiert werden kann, schränkt ihre Fähigkeit ein, auf der Grundlage der in den Kreditanträgen enthaltenen Informationen zu lernen.

Daher könnte man skeptisch sein, ob eine effiziente Nutzung harter Informationen durch die Maschine die Vorhersage von Kreditergebnissen übertreffen, wo doch Kreditsachbearbeiter weiche und harte Informationen bei der Kreditvergabe kombinieren.

Der hier vorgestellte Fall aus Indien versucht genau diese Frage zu beantworten. Unter Verwendung eines Portfolios von 11.000 Kreditnehmerdaten kann festgestellt werden, dass die Ablehnung von Kreditanträgen, die vom ML-Algorithmus als am risikoreichsten eingestuft, aber von den Sachbearbeitern akzeptiert worden sind, die Leistung in Bezug auf Ausfall und Rentabilität verbessert.

Schließlich kann gezeigt werden, dass der ML-Algorithmus seine Outperformance auch nach Berücksichtigung von Gerechtigkeitsüberlegungen bei der Kreditvergabe an sozial schwache Bevölkerungsgruppen beibehält.

Die Ergebnisse deuten darauf hin, dass die Verwendung des ML-Algorithmus die Gesamteffizienz der Kreditvergabe verbessert. Er trägt dazu bei, die Kreditvergabe zu erhöhen, ohne dass es zu einem Anstieg der Ausfallraten kommt.

Autor
Silvio Andrae beschäftigt sich seit mehr als 20 Jahren mit Fragen aus dem Bereich „Development Finance“ und hat praktische Erfahrungen in Lateinamerika, Afrika und Asien gesammelt.

Hier finden Sie weitere Beiträge aus den Betriebswirtschaftlichen Blättern (BBL)

⇒ Infotipp: Setzen Sie auf diesen Link ein Bookmark - und Sie haben jederzeit einen Überblick über die Betriebswirtschaftlichen Blätter.

Silvio Andrae (Foto oben: shutterstock)
– 3. August 2021
1
Dateianhänge