Bildungsproblem Türken
3. PISA 2015: Niveauunterschiede zwischen Deutschland und Türkei – Effektstärke
Zum Anfang der Serie → Bildungsproblem Türken
Alle nationalen und internationalen Bildungsstudien belegen übereinstimmend, dass Türken ein sehr viel niedrigeres Bildungsniveau aufweisen als Deutsche. Der Leistungsunterschied zwischen Deutschland und der Türkei bei PISA 2015 beträgt fast eine ganze Standardabweichungseinheit.
Im → Teil 2 haben wir gesehen, dass in der jüngsten PISA-Studie [1] der Unterschied zwischen Deutschland und der Türkei in der Lesekompetenz 81, in den Naturwissenschaften 84 und in Mathematik 86 Punkte betrug.
Der Vollständigkeit halber sei angemerkt, dass diese Unterschiede selbstverständlich statistisch signifikant sind. Bei den sehr großen Stichproben werden bereits Differenzen von 8 bis 10 Punkten signifikant. Mit mehr als 80 Punkten liegt die Bildungskluft zwischen Deutschland und der Türkei jenseits von Gut und Böse.
Zur Beurteilung von Mittelwertsunterschieden wird häufig ein Maß der Effektstärke verwendet, das auf Cohen [2] zurückgeht und durch den Buchstaben d gekennzeichnet wird. Die Effektstärke d ergibt sich daraus, dass man die Mittelwertsdifferenz durch die Standardabweichung dividiert [A1].
In Tabelle 3.1 sind die Mittelwerte sowie die Standardabweichungen und die Effektstärken zusammengefasst.
Naturwissenschaften | Lesekompetenz | Mathematik | |
Mittelwert | |||
Deutschland | 509 | 509 | 506 |
Türkei | 425 | 428 | 420 |
Standardabweichung | |||
Deutschland | 99 | 100 | 89 |
Türkei | 79 | 80 | 82 |
Effektstärke d | |||
0,93 | 0,89 | 1,00 |
Tabelle 3.1 zeigt, dass sich Deutschland und die Türkei auch bei den Standardabweichungen deutlich unterscheiden. In allen Bereichen ist die Streuung der Messwerte in Deutschland größer. Auf diesen Punkt werden wir später zurückkommen. Es sei an dieser Stelle jedoch angemerkt, dass die Streuung in Deutschland auch erheblich größer ist als in den OECD-Ländern (siehe Teil 2).
Nach einem Vorschlag von Cohen gilt bei der Beurteilung der Mittelwertsdifferenz zwischen zwei Gruppen ein d-Wert von 0,2 als kleiner, 0,8 als mittlerer und 1,4 als großer Effekt. Gemäß dieser Konvention entsprechen die Unterschiede zwischen Deutschland und der Türkei in allen drei Leistungsbereichen einem mittleren Effekt.
Cohen’s Effektstärkemaß d ist zweifellos eine sehr wichtige Statistik. Bei der Interpretation von „klein“, „mittel“ oder „groß“ muss man jedoch im Auge behalten, dass es sich hier lediglich um eine Faustregel handelt, die auf der Grundlage von tausenden Untersuchungen aus sozialwissenschaftlichen Forschungsberichten abgeleitet wurde. Diese Interpretation von Cohen’s d ist also lediglich eine Relativierung auf das, was in sozialwissenschaftlichen Untersuchungen typischerweise zu beobachten ist.
In PISA und anderen nationalen und internationalen Bildungsstudien werden „Effektstärken von unter 0,2 als gering, Effektstärken im Bereich um 0,5 als mittelgroß und Effektstärken von über 0,8 als groß angegeben“ [1; S.325]. Gemäß dieser Interpretation liegt in allen Leistungsbereichen ein großer bis sehr großer Effekt vor.
Wie immer man Effektstärken verbal charakterisieren mag, gilt:
- Die Qualifikation eines Effekts als „klein“, „nützlich“ oder „groß“ sagt so gut wie nichts über die praktische Bedeutsamkeit eines Unterschieds aus.
In der medizinisch-pharmazeutischen Forschung hat man es oftmals mit Effekten zu tun, die nach der Cohen’schen Faustregel als winzig klein einzustufen sind. Dennoch kann ein Medikament, das einen im Cohen’schen Sinne winzigen Effekt aufweist, Tausende Menschenleben retten. Hier kann also ein winziger Effekt eine außerordentlich große praktische Bedeutsamkeit haben.
Auf der anderen Seite wird vermutlich die Präferenz für rosa- und lilafarbene Kleidungsstücke einen Unterschied zwischen Männern und Frauen ergeben, der einer sehr großen Effektstärke entspricht. Für die Modebranche ist dies äußerst bedeutsam, darüber hinaus wird das aber kaum jemanden interessieren.
Um die praktische Bedeutsamkeit der Bildungsunterschiede zwischen Deutschland und der Türkei zu beurteilen, sind also andere Kriterien heranzuziehen als Cohen’s d. Diesem Thema wenden wir uns in der Folge zu. Dabei wird sich zeigen, dass die Bezeichnung „mittlerer Effekt“ eine groteske Untertreibung darstellt; und selbst die Bezeichnung „großer Effekt“ würde der enormen praktischen Bedeutsamkeit in keiner Weise gerecht.
Hier gibt es → Teil 4: PISA 2015: Lesekompetenz in Deutschland und in der Türkei
Literatur
[1] OECD (2016) PISA 2015 Ergebnisse. Exzellenz und Chancengleichheit in der Bildung. Band I. W. Bertelsmann Verlag, Germany. DOI 10.3278/6004573w
[2] Cohen, J. (19772). Statistical power analysis for the behavioral sciences. New York: Academic Press.
Anmerkungen
[A1] Das heißt: Der Unterschied zwischen den Gruppen wird auf die Streuung innerhalb der Gruppen relativiert, wobei die Standardabweichung das Maß der Streuung innerhalb der Gruppen darstellt. Bei unterschiedlichen Standardabweichungen in den Teilgruppen muss eine gewichtete Standardabweichung für die Gesamtgruppe ermittelt werden.
***
Stichwörter:
Bildung, Bildungsforschung, Deutschland, Türkei, Türken, PISA, Effektstärke, Statistik, Cohen’s d
4 Kommentare zu „Bildungsproblem Türken – Teil 3“