1. September 2010

Sarrazin auf dem Prüfstand der Wissenschaft (2): Ist Intelligenz zu 50 bis 80 Prozent vererbbar? - Teil 1: Definition und Messung von Intelligenz

In dem Streitgespräch mit den "Zeit"-Redakteuren Bernd Ulrich und Özlem Topcu sagte Thilo Sarrazin: "Wissenschaftlich belegt ist, dass Intelligenz zu 50 bis 80 Prozent vererbbar ist". Stimmt das? Ist es wissenschaftlich belegt? Um den Stand der Forschung zu dieser Frage zu verstehen, sollte man sich einige Grundlagen klarmachen.

Was ist eigentlich Intelligenz? Ein bekanntes Zitat aus einem Aufsatz des amerikanischen Psychologen Edwin G. Boring aus dem Jahr 1923 lautet: "Intelligence is what the tests test"; Intelligenz ist das, was die Tests testen (meist ungenau zitiert als "Intelligenz ist das, was ein Intelligenztest mißt" o.ä.).

Das ist wahr, und es ist kein Witz, auch wenn es danach klingt. Denn damit wird schlicht gesagt, daß ein wissenschaftlicher Begriff "operational definiert" wird, wie man sagt - also durch die Meßoperation, mit der er verknüpft ist. Zeit beispielsweise ist das, was Uhren messen; auch sie können wir operational nur so definieren, durch die zugehörige Meßoperation.

Nun wäre das freilich eine seltsame Uhr, die einen umso höheren Wert anzeigt, je heller es in ihrer Umgebung ist; aber morgens und mittags denselben Wert. Wenn jemand uns mit einer derartigen Uhr beglücken wollte, dann würden wir sie nicht haben wollen; denn sie mißt erkennbar nicht das, was wir uns unter dem Begriff der Zeit vorstellen.

Eine gute Operationalisierung muß mit unserem intuitiven Verständnis von dem übereinstimmen, was operationalisiert werden soll. So ist es auch mit Intelligenztests. Sie operationalisieren das, was wir alltagspsychologisch mit Intelligenz meinen.

Sie operationalisieren es und machen es dadurch exakt meßbar.

Wenn wir einen Menschen gut kennen, dann können wir ein sicheres Urteil darüber fällen, ob er sehr intelligent ist, weniger intelligent oder vielleicht strohdumm. Wir können das aber nur im Groben sagen. Der Vorteil des Tests liegt darin, daß man es präzise bestimmen kann. Wir können dann nicht nur sagen: "X ist ziemlich intelligent", sondern: "X hat einen IQ von 112".

Eine solche Übereinstimmung zwischen unserem intuitiven Verständnis von dem, was ein Begriff meint, und seiner Operationalisierung bezeichnet man als die Validität eines Tests; valide ist ein Test, der "paßt", der "triftig" ist, wie man gesagt hat.

Die Validität wird allerdings nicht nur an unserer Intuition gemessen, sondern auch objektiv an sogenannten "Außenkriterien". Man vergleicht zum Beispiel, wie gut verschiedene Personengruppen in einem Intelligenztest abschneiden. Würde jemand einen Test vorschlagen, bei dem eine größere Stichprobe von Professoren und Spitzenmanagern schlecht und eine Stichprobe von Hilfsarbeitern und Müllkutschern gut abschneidet, dann würde man ihm diesen Test nicht abnehmen. Er wäre offensichtlich nicht valide.

Untersuchungen zu den gängigen Intelligenztests zeigen, daß sie recht valide sind. Die Korrelation (der statistische Zusammenhang) zwischen der gemessenen Intelligenz und dem Berufserfolg ist zum Beispiel höher als die Korrelation des Berufserfolgs mit irgend einem anderen persönlichen Merkmal.

Das genügt eigentlich, um das Konzept der Intelligenz zu verstehen. Falls Sie Lust an Definitionen haben, können Sie hier die Dutzende von Definition nachlesen, die man sich für Intelligenz ausgedacht hat. Zu unserem Wissen tragen solche definitorischen Klimmzüge wenig bei.



Wie mißt man Intelligenz? Wie kam man überhaupt auf die Idee, Intelligenz durch Tests zu messen? Es waren praktische Anforderungen; und zwar die des Schulsystems in Frankreich und die der Wehrpflicht in den USA, beides zu Beginn des 20. Jahrhunderts.

Ende des 19. Jahrhunderts wurde in Frankreich die Schulpflicht eingeführt. Damit stellte sich u.a. die Frage, welche Kinder in eine normale Schule eingeschult werden konnten und welche eine Sonderschule besuchen sollten. Der Psychologe Alfred Binet wurde von der Regierung beauftragt, dafür ein Meßinstrument zu schaffen.

Zusammen mit seinem Mitarbeiter Théodore Simon entwickelte Binet aufgrund ausgiebiger Beobachtungen an Kindern eine Reihe von 30 Standard-Aufgaben; von den einfachsten wie der Aufgabe, auf den Körperteil zu zeigen, den man dem Kind nannte, über einfache Gedächtnisaufgaben bis zu schwierigen Aufgaben wie derjenigen, eine Reihe von sieben Ziffern zu wiederholen oder Unterschiede zwischen Begriffen zu erkennen. Der Test war 1905 einsatzbereit; 1908 wurde er in einer verbesserten Form vorgelegt.

Sie sehen an Binets Werk den Grundgedanken der Konstruktion eines Intelligenztests: Man überlegt, was bei einem Menschen - hier einem Kind - das ausmacht, was wir Intelligenz nennen, und konstruiert entsprechende Aufgaben; sogenannte "Skalen", weil die Leistung in Skalenwerten ausgedrückt wird. Aus der Gesamtheit der Werte auf den einzelnen Skalen ergibt sich die Gesamtintelligenz.

Das ist heute noch so wie zur Zeit Binets vor mehr als hundert Jahren. Eine gerade Linie führt von Binet zu unseren heutigen Intelligenztests. Sie können diese Geschichte hier nachlesen.

Binets Test wurde von dem Psychologen Terman in die USA übernommen und modifiziert (Stanford-Binet-Test); 1917 wurde für die Armee eine Form entwickelt, bei der die Probanden in Gruppen getestet werden konnten statt einzeln (der Army Alpha-Test).

Terman übernahm bei seiner Weiterentwicklung von Binets Test eine Idee des deutschen Psychologen William Stern. Dieser hatte das Konzept des Intelligenzquotienten vorgeschlagen: Man ordnet der Punktzahl, die ein Kind erreicht hat, ein bestimmtes Intelligenzalter zu und teilt es durch das Lebensalter. Um nicht mit Kommazahlen hantieren zu müssen, wurde dieser Quotient mit 100 multipliziert.

Hat ein Kind genau die Punktzahl des Durchschnitts seiner Altersgruppe, dann hat es demnach einen IQ von 100. Erzielt ein zehnjähriges Kind eine Leistung, die dem Durchschnitt der Elfjährigen entspricht, dann hat es einen IQ von 11 : 10 x 100, also 110; und so fort.

Das funktioniert natürlich nur bei Kindern. Später hat der Psychologe David Wechsler eine andere, formalere Definition vorgeschlagen, die sich an der Normalverteilung (der "Gauss'schen Glockenkurve") orientiert. Ein IQ-Wert ist dabei dadurch definiert, wieviel Prozent der Bevölkerung einen höheren bzw. einen niedrigeren Punktwert im Test erzielen.

Ein IQ von 100 entspricht einer Leistung, die von genau 50 Prozent der Bevölkerung erreicht wird. Wer mit seiner Leistung eine Standardabweichung oberhalb des Mittelwerts liegt, der hat einen IQ von 115; wer eine Standardabweichung darunter liegt, einen IQ von 85. Entsprechend werden IQs von 130 und von 70 bei Leistungen erreicht, die zwei Standardabweichungen ober- oder unterhalb des Mittelwerts liegen.

"Eine Standardabweichung oberhalb des Mittelwerts" bedeutet, daß jemand, der den zugehörigen IQ von 115 hat, intelligenter ist als 84 Prozent der Bevölkerung und somit weniger intelligent als 16 Prozent. Entsprechend ist jemand mit einem IQ von 85 - also eine Standardabweichung unterhalb des Mittelwerts - intelligenter als 16 Prozent und weniger intelligent als 84 Prozent. Wegen der Form der Normalverteilung, die zu den Extremwerten hin sehr flach wird, sind IQs von 130 und mehr oder von 70 und weniger bereits sehr selten; nur jeweils 2,5 Prozent der Bevölkerung liegen mit ihrem IQ über 130 oder unter 70.

Wechslers Test wurde in den fünfziger Jahren ins Deutsche übersetzt und an einer deutschen Stichprobe geeicht; alles Wissenswerte über diesen "Hamburg-Wechsler-Intelligenztest für Erwachsene" (HAWIE) finden Sie hier. Wenn Sie sich die Liste der Skalen (also der einzelnen Aufgaben) ansehen, dann können Sie erkennen, wie vielgestaltig das ist, was mit diesem Test gemessen wird: Vom Kopfrechnen und Kurzzeitgedächtnis über das allgemeine Verständnis von Lebenssituationen im sogenannten Verbalteil bis zum Legen von Puzzles und dem Ergänzen von Bildern im Handlungsteil.



Erblichkeit der Intelligenz: Daß es, operationalisiert durch den IQ, zwischen Menschen große Unterschiede in ihrer Intelligenz gibt, ist unbestritten. Aber wo kommen sie her? Das berührt eine jahrhundertealte Kontroverse, die im Englischen unter der Überschrift "nature vs. nurture" geführt wird - Natur gegenüber Nahrung, wörtlich übersetzt. Im Deutschland spricht man meist vom Anlage-Umwelt-Problem.

Dieses Problem besteht nicht nur für die Intelligenz, sondern für alle Persönlichkeitsmerkmale; es reicht bis in die Philosophie hinein, wo seit der Antike die Frage diskutiert wird, inwieweit unser Wissen angeboren ist und inwieweit wir es durch Erfahrung erwerben.

Und es reicht in die Politik, ja in die Ideologie hinein. Traditionell tendiert man auf der Linken dazu, den Einfluß der Umwelt hoch zu veranschlagen, während Konservative eher dazu neigen, dem Faktor der Vererbung ein großes Gewicht zu geben. Daß Vererbung bei der Intelligenz überhaupt eine Rolle spielt, wird von nicht wenigen Linken stracks geleugnet.

Aber nun ist dies ja so wenig eine ideologische Frage, wie ob die Schildkröte ein Säugetier ist oder wie weit der Mond von der Erde entfernt ist. Es ist eine rein empirische Frage. Keine politische Haltung, keine "Weltanschauung" und keine Ideologie bringt uns der Antwort auch nur einen Millimeter näher; sondern allein gute Forschung.

Aber wie kann man denn empirisch ermitteln, in welchem Ausmaß Intelligenz durch die Gene und in welchem Ausmaß sie durch die Umwelt bestimmt wird? Das ist eine Frage, bei deren Beantwortung die Wissenschaft in den vergangenen Jahrzehnten große Fortschritte gemacht hat. Damit befasse ich mich im zweiten Teil.



Links zu allen Folgen dieser Serie finden Sie hier



© Zettel. Für Kommentare bitte hier klicken. Titelvignette von der Autorin Nina unter Creative Commons Attribution-Share Alike 3.0 Unported-Lizenz freigegeben. Bearbeitet.