In Nachwuchsleistungszentren der Fußball-Bundesligisten werden reihenweise falsche Entscheidungen getroffen. Was klingt wie eine plumpe Schuldzuweisung oder ein Überspielen einer emotionalen Verletzung, ist nichts anderes als ein Fakt. Um besser zu verstehen, weshalb im Fußball falsche Entscheidungen getroffen werden, wie bessere Entscheidungen erarbeitet werden können und wie Spieler sowie deren Eltern besser mit den Ergebnissen umgehen können, habe ich hier ein komplexes Gedankenexperiment gestartet.
Zum Thema: Bessere und gerechte Entscheidungen im Fußball treffen
Stellen Sie sich vor, Sie und Ihr bester Freund sind talentierte junge Spieler mit einer hervorragenden Prognose für den Profifußball. Sie beiden haben gerade erfolgreich das NLZ durchlaufen und zuletzt in der Jugendfußball-Bundesliga gekickt. Aufgrund dessen wurden Sie beide für einen renommierten Bundesligisten gescoutet und zum Probetraining eingeladen. Ihr Probetraining lief wie am Schnürchen. Der Cheftrainer ist sichtlich von Ihrem Talent beeindruckt und Sie schlendern anschließend zuversichtlich über das Trainingsgelände. Die Sonne strahlt und die Mitspieler verabschieden Sie mit den Worten: „Sehr gutes Training, bis hoffentlich bald!“ Vieles scheint zu passen. Ihr Freund hat sein Probetraining am darauffolgenden Tag. Auch seine persönliche Vorstellung lief prima. Doch noch während er das Trainingsgelände verlässt, regnet es stark. Es gießt wie aus Eimern. Ein paar Wochen später gab es das Gespräch mit dem Trainer. Ihr Freund wurde genommen, Sie aber nicht. Ihr Kopf beginnt zu rattern: Wie kann das sein? Sie haben beide ein hervorragendes Probetraining geboten und könnten jeweils verschiedene Spielpositionen im Team bekleiden. Warum er, warum ich nicht?
Nun, möglicherweise lag das Ergebnis nicht an Ihren fußballerischen Fähigkeiten, sondern an völlig zufälligen und unvorhersehbaren Faktoren – zum Beispiel am Wetter. Ich stellte in einer kleinen Stichprobe fest, dass sich Trainer an regnerischen Trainingstagen stärker auf Erfahrungswerte anderer konzentrierten statt auf das gegenwärtige Probetraining. Dagegen sind sie an sonnigen Tagen sensibler für fußballerische Qualitäten, wie bspw. Antizipation, die Technik, das Zweikampfverhalten und die Handlungsschnelligkeit. Wir erinnern uns: Bei Ihrem Probetraining schien die Sonne. Es könnte also sein, dass der Trainer mehr auf die Aussage anderer gehört hat als auf die Trainingsleistung. Oder Ihre Ablehnung hatte ganz andere Gründe. Vielleicht waren die letzten Probespieler vor Ihnen erfahrener wie Sie. Vielleicht hatte der Trainer einfach nur einen schlechten Tag. Oder die saisonale Vorbereitung und Testspiele liefen nicht gut. So irrelevant das alles klingt: Relevante Studien in anderen Berufsfeldern und eigene Erfahrungen weisen auf diese Verzerrungen hin. Das bedeutet: Das menschliche Urteilsvermögen kann von willkürlichen und unvorhersehbaren Faktoren beeinflusst werden. In all den beschriebenen Szenarien trifft ein und dieselbe Person in grundlegend identischen Situationen unterschiedliche Entscheidungen. Die Frage ist: Warum?
Der Unterschied zwischen Bias und Noise
Unternehmen wir ein weiteres Gedankenexperiment. Dieses Mal verschlägt es Ihrem Freund und Sie an die Torwand. Sie stehen also nebeneinander, jeweils mit einem Ball am Fuß und schießen auf die gegenüberliegende Torwand. Zwar sind Sie beide gute Kicker, dennoch gibt es einen Unterschied: Ihre Bälle flogen weit über die Torwand hinüber. Sie weichen ohne erkennbares Muster von den unteren und oberen Löchern ab. Die Bälle ihres Freundes hingegen wiesen ein anderes Bild auf: Bei ihm flogen die Bälle alle in einer Region unten links oder waren ein Volltreffer. Woran hat es gelegen? Das Standbein und die Fußstellung waren deutlich unterschiedlich sowie auch der Anlaufwinkel. Auch die anschließende Korrekturempfehlung und weitere Schüsse auf die Torwand wiesen keine Veränderung bei Ihnen beiden auf. Dieses Beispiel ist eine Metapher für zwei unterschiedliche Arten von Urteilsfehlern. Wenn sich jemand immer nach demselben Muster oder Verhalten irrt, sprechen wir von einem Bias (Wason, 1968). Besonders in der Psychologie steht das Bias „kognitive Verzerrung“ für eine Voreingenommenheit, dass das objektive Urteilsvermögen eines Menschen verzerrt. Seine Entscheidungen weichen systematisch vom Optimum ab – genau wie die oberen Schüsse Ihrerseits. Das Bias wurde bereits vielfach untersucht, weil sie sich an konkrete Ursachen knüpfen lassen. Doch genauso gibt es Entscheidungen, die wie Ihre Schüsse völlig wild und willkürlich vom Optimum abweichen. Hier spricht die Psychologie vom sogenannten Noise (Kahnemann et. al. 2021) von einem störenden Rauschen, das die Ergebnisse menschlicher Entscheidungen zufällig und unberechenbar streut. Jetzt erinnern Sie sich an den Trainer des Bundesligisten. Die entscheidende Frage wäre, ob seine Entscheidung gegen Sie durch ein systematisches Bias oder durch Noise, also eher zufällig, beeinflusst wurde?
Wir können festhalten: Bei Urteilsfehlern entscheiden wir zwischen Bias und Noise, also zwischen einer systematischen und einer völlig willkürlichen Abweichung von der optimalen Entscheidung. Konzentrieren wir uns nun auf die Frage, wann es eigentlich zu willkürlichen Urteilsfehlern kommt?
Wir verkennen, wie viel wir nicht wissen
Angenommen ein Bereichsleiter U12-U16 und die dazugehörigen Cheftrainer im NLZ müssen entscheiden, ob Jugendspieler aussortiert werden oder im Verein verbleiben dürfen. Diese tragen mit Ihrer Entscheidung eine große Verantwortung. Die abschließenden Entwicklungsgespräche über ihre Zukunft stehen noch aus. Verweigern sie den Verbleib im NLZ zu Unrecht, verlieren die Jugendspieler möglicherweise ihr Selbstvertrauen und hören mit dem Fußball auf. Die Familie, Freundschaften und die Schule könnten darunter leiden. Dürfen die Nachwuchsspieler im NLZ verbleiben, müssten evtl. andere dafür ihren Platz räumen. All diese Konsequenzen muss der Bereichsleiter und die Trainer bei ihren Entscheidungen in Betracht ziehen. Darum stützen sie sich auf ihre langjährige Erfahrung, um dessen Entwicklungen vorherzusagen. Ist das ausreichend genug? Aber: Wir Menschen sind furchtbar schlecht darin, akkurate Vorhersagen zu treffen.
In diesem Zusammenhang möchte ich eine interessante Studie aus dem Jahr 2018 heranziehen. Das Team von Sendhil Mullainathan entwickelte einen Algorithmus, der ermittlungsrechtliche Entscheidungen simulierte. Die Forscher fütterten das Programm mit Daten aus rund 760.000 echten Anhörungen und kamen zu einem ernüchternden Ergebnis: Der Algorithmus hätte bessere Entscheidungen getroffen als die Gerichte. Er hätte die Zahl der Inhaftierungen um 42 Prozent und die Delikte entlassener Angeklagter um 24 Prozent gesenkt. Da stellt sich die Frage: Warum führen die jahrelange Ausbildung und Expertise menschlicher Richter zu schlechteren Urteilen als Algorithmen? Die Antwort ist simpel: weil Richter Menschen sind.
Ähnliches lässt sich auch auf den Fußball übertragen. Wenn wir Prognosen von Spieler treffen, sehnen wir uns insgeheim nach einer erfolgreichen Karriere für den jungen Spieler. Das ist wie ein mentales Puzzlespiel. Sobald wir eine mögliche Antwort finden, durchfährt uns ein inneres Signal mit dem Zuruf: „Der Spieler hat eine große Zukunft vor sich!“ Diese Vorhersagen stellen uns zufrieden, weil sie mit unseren bisherigen Erfahrungen im Fußball kohärent sind. Aber die Macht dieser emotionalen Befriedigung lässt uns die Beschränktheit unseres Urteilsvermögens vergessen. Ich spreche dann von objektiver Unwissenheit. Wir verkennen, wie viel wir nicht wissen. Wir ignorieren, dass unser vorhandenes Wissen möglicherweise falsch oder irreführend ist. Wir ignorieren unsere Ignoranz. Mit anderen Worten: Wir Menschen lassen uns bei Vorhersagen leicht davon verleiten, was sich emotional richtig anfühlt und verkennen unser eigenes Unwissen. Nun wollen wir ja aber keine Trainer durch Maschinen ersetzen. In dem Fall könnten wir diesen Blogbeitrag an dieser Stelle abbrechen. Daher geht es im Folgenden darum, wie sich das menschliche Urteilsvermögen im Fußball verbessern lässt.
Noise passt (noch) nicht in den Fußball
Sie werden bemerkt haben, dass meine vorherigen Abschnitte oft mit einer kleinen Geschichte beginnen. Ich skizziere eine kurze Handlung mit Ort und Zeit, in der ein Charakter auf dem Weg zu seinem Ziel mit Widerstand konfrontiert wird. Warum ich das mache? Weil der menschliche Verstand Geschichten liebt. Informationen, die in Narrative eingebettet sind, bleiben besser im Gedächtnis haften. Wir haben gesehen, dass Noise de facto viele menschlichen Urteile verfälscht. Da stellt sich doch die Frage: Wenn Noise so präsent ist, warum hört man dann so wenig im Fußball davon?
Die Antwort lautet: weil Noise sich nicht in Geschichten verpacken lässt. Viele der jüngsten psychologischen Erkenntnisse zeigen, wie sehr unsere Wahrnehmung über Narrative funktioniert. Heute wissen wir, dass unser Verstand Geschichten braucht, um sich die Welt zu erklären. Ein Beispiel ist das gut dokumentierte Phänomen des fundamentalen Attributionsfehlers (Aronson et.al. 2008): Wir tendieren dazu, Menschen für Ergebnisse verantwortlich zu machen, die sich besser durch willkürliche Umstände erklären lassen. Mit anderen Worten: Wir sehen überall Charaktere, Handlungen und Zusammenhänge. Die Dinge erscheinen uns nur dann sinnvoll, wenn wir daraus eine Geschichte stricken können. Die treibende Kraft dahinter ist der psychologische Mechanismus des Naiven Realismus. Wir setzen unsere subjektive Wahrnehmung mit objektiver Wahrheit gleich und halten sie für die Realität. Sobald ein Ereignis diese Realität infrage stellt, konstruiert unser Verstand Narrative, um Widersprüche zu entkräften. Das führt dazu, dass wir teilweise so lange nach einer Geschichte suchen, bis wir uns das Unerklärliche im Nachhinein doch noch erklären können. Doch genau hier liegt das Problem: Noise ist zu sperrig für Narrative. Noise ist nicht kausal und passt nicht zu unseren Erklärungsmustern. Es liefert nichts als scheinbar sinnlose und frustrierende erzählerische Versatzstücke. Wir übersehen Noise, weil es nicht zum Rest unserer Geschichte passt. Darum registrieren wir Noise nur statistisch. Oder wir verwechseln es mit Bias, denn Bias lässt sich auszählen. In einzelnen Fällen spielt Voreingenommenheit durchaus eine Rolle. Aber zusammengenommen ergeben diese Fehlentscheidungen nichts als zufälliges Chaos. Nun haben wir ein Gefühl dafür, was Noise alles anrichten kann. Aber wie können wir damit umgehen?
Mentale Hygiene
Steigen wir wieder mit einem Gedankenexperiment ein: Sie wurden in der Kindheit umfangreich gegen verschiedene Kindererkrankungen geimpft. Mit dieser lebenswichtigen Vorgehensweise hindern sie unzählige Erreger daran, ihren Körper zu befallen. Dasselbe können wir tun, um unser Urteilsvermögen zu verbessern. Wir können eine Entscheidungshygiene betreiben und Prinzipien einführen, die unsere Entscheidungen weniger verzerren. Der erste Schritt – quasi das Pendant zum Impfen – besteht darin, sich vor wichtigen Entscheidungen mit den Grundlagen statistischen Denkens zu befassen. Wir haben gesehen, dass unser geschichtsfixierter Verstand aus allem Narrative stricken will. Wir sehen überall Bedeutungen und Zusammenhänge und verkennen unsere eigene Ignoranz. Genau so entstehen willkürliche, verrauschte Urteilsfehler. Sie müssen daher versuchen, einen Blick von außen einzunehmen:
Nehmen wir an, Ihr Verein stellt einen neuen Vereinsmanager ein und Sie wollen einschätzen, ob dieser Erfolg hat. Dann könnten Sie seine Ausbildung, seinen Ruf und seine Vita durchleuchten. Aber letztendlich erhalten Sie nur einen Haufen komplexer und potenziell irreführender Informationen.
Ein Ansatz mit weniger Verzerrungen bestünde darin, einen Referenzrahmen zu schaffen. Sie könnten recherchieren, welchen Umsatz Vereinsmanager in der Fußball-Bundesliga durchschnittlich erwirtschaften oder sie schauen sich an, wie oft die Rekrutierung neuer Manager in steigenden Aktienwerten der Vereine resultieren. Beides schafft eine statistische Basis, mit der Sie ein allzu intuitives Urteil vermeiden. Natürlich sollen sich Entscheidungen emotional richtig anfühlen, aber im Idealfall doch aus den richtigen Gründen, oder? Heben Sie lieber die emotionale Belohnung für eine fundierte und möglichst akkurate Einschätzung auf. Zum Beispiel kann es ein spannendes mentales Puzzle sein, die Amtszeit Ihres neuen Managers mit den Aktienwerten des Vereins zu verknüpfen – aber auch völlig irrelevant. Versuchen Sie stattdessen, schwere Einschätzungen in separate Einzelfragen herunterzubrechen und auf unabhängige Urteilende zu verteilen. Wir halten also fest: Entscheidungshygiene kann Verzerrungen reduzieren. Entscheidend dafür ist, dass Sie nicht allein aus dem Bauch heraus urteilen, sondern vor dem Hintergrund solider Referenzen.
Der Nachwuchs- und Profisport wäre gut beraten die Vielfalt an Meinungen und Entscheidungen gegenüber Nachwuchsspielern zu berücksichtigen. Aber wenn Trainer und Bereichsleiter über substanziell ähnliche Altersgruppen und Fähigkeiten urteilen, ist Individualismus fehl am Platz. Sie müssen sich darauf verständigen, dass Genauigkeit die höchste Priorität hat. Im nächsten Schritt müssen die Urteilenden selbst an der Erstellung von Testszenarien für einen Noise Audit – mehrere Fachkräfte urteilen unabhängig über ein Thema – beteiligt werden. Andernfalls stehen sie der Prüfung kritisch und ablehnend gegenüber. Im letzten Schritt müssen die Urteilenden durch den Noise Audit erkennen und verstehen, wie hoch die negativen Folgen ihrer Urteilsfehler sind. Das heißt unterm Strich: Damit Verzerrungen in der Bewertung von Nachwuchsspielern reduziert werden kann, müssen sich die Verantwortlichen gemeinsam darauf einigen, wie genau ein optimales Entwicklungsgespräch und Beurteilung von Spielern aussehen kann.
Fazit
Stellen wir uns zum Abschluss noch einmal die Fragen: Was ist Noise? Warum ist es ein Problem im Fußball? Und wie lässt es sich bekämpfen? Am besten lässt sich Noise durch die Abgrenzung zum Bias erklären. Ein Bias ist eine systematische Abweichung von einer optimalen, gerechten und möglichst objektiven Einschätzung von Jugendspielern. Noise meint demgegenüber die völlig willkürliche und zufällige Streuung von Urteilsergebnissen wie die zahlreichen unterschiedlich gerechten oder weniger gerechten Entwicklungsgespräche im Nachwuchsfußball und die Entscheidung über dessen Verbleib. Das Problem ist, dass wir uns bei der Untersuchung von Urteilsfehlern bislang nur auf Bias konzentriert haben. Wir haben also nicht analysiert, warum die Nachwuchsleistungszentren von urteilenden Verantwortlichen substanziell identische Talente unterschiedlich falsch bewerten.
Noise reduzieren und die Nachwuchsleistungszentren dazu befähigen, einheitlicher und gerechter zu urteilen – von Vereinsmanager und sportliche Leiter bis hin zu den Trainern der U-Mannschaften. Die Verantwortlichen in den Nachwuchsleistungszentren müssen verstehen, wie schwerwiegend ihre kollektiven Urteilsfehler sein können. Sie müssen sich gemeinsam auf das eigentliche und ultimative Ziel ihrer Bewertungen in den NLZ-Entwicklungsgesprächen einigen. Die Noise-Reduzierung ist keine einfache Arbeit, aber eine notwendige für den deutschen Fußball – insbesondere für viele Talente da draußen. Denn Noise selektiert frühzeitig junge Talente, Ressourcen und bestärkt die Ungerechtigkeit.
Weitere vertiefende Artikel zum Thema finden Sie hier:
Literatur
Aronson, E.; T. D. Wilson, T.D. Akert, R.M. (2008): Sozialpsychologie. Pearson Studium. 6. Auflage 2008. S. 108.
Kahneman, D., Sibony, O., Sunstein, C. R, Schmidt, Th. (2021): Noise: Was unsere Entscheidungen verzerrt – und wie wir sie verbessern können. Siedler Verlag; 2. Edition (17. Mai 2021)
Kleinberg, J.; Sendhil Mullainathan, S.; Manish Raghavan, M. (2017): Trade-Offs in the Fair Determination of Risk Scores, Proceedings of the 8th Innovations in Theoretical Computer Science Conference (ITCS’17), 2017, 43:1–43:23.
Kleinberg, J.; Mullainathan, S. (2018): Simplicity Creates Inequity: Implications for Fairness, Stereotypes, and Interpretability. Studie lesen: https://arxiv.org/abs/1809.04578
Wason, P. (1968): Reasoning about a rule. In: Quarterly Journal of Experimental Psychology, Band 20