21. September 2010

Sarrazin auf dem Prüfstand der Wissenschaft (4): Demographische Entwicklung und Geburtenziffer von Einwanderern - Teil 1: Grundbegriffe

In gewisser Hinsicht kann Thilo Sarrazin mit der Wirkung seines Buchs zufrieden sein. Nachdem die anfänglich schrillen Töne leiser geworden sind, ist eine öffentliche Diskussion über die Integration von Einwanderern in Gang gekommen (siehe "... daß die Aufregung möglichst schnell vorbeigehen möge"; ZR vom 12. 9. 2010).

Aber die Integration von Einwanderern ist ja gar nicht das Hauptthema von Sarrazins Buch. Dessen eigentliches Thema ist die Zukunft unseres Landes. Die Probleme der Einwanderung sind nur ein Aspekt, den er diskutiert. Insofern kann Sarrazin mit der Resonanz nicht zufrieden sein.

Viel zentraler als das Thema Integration ist aus Sarrazins Sicht die demographische Entwicklung; präziser: die demographische Entwicklung in ihrer Auswirkung auf unseren künftigen Wohlstand.

Das hängt mit der Einwanderung nur indirekt zusammen; und zwar nach Sarrazins Überzeugung dadurch, daß die gegenwärtige Einwanderung aus moslemischen Ländern nicht dazu geeignet ist, Deutschland mit den hochqualifizierten Arbeitskräften zu versorgen, die wir künftig verstärkt benötigen werden, wenn wir bei einer schrumpfenden Bevölkerung unseren Wohlstand halten wollen.

Das ist das Gebiet, auf dem der promovierte Volkswirt und Statistiker Sarrazin seine Kernkompetenz hat. Aber seltsam - gerade dort wurde er angegriffen. Sind diese Angriffe berechtigt, oder hat Sarrazin Recht?

Um das beurteilen zu können, sollte man sich zunächst einige Grundbegriffe klarmachen.



In der Demographie muß man drei Ebenen unterscheiden, die in der öffentlichen Diskussion zu Sarrazin oft durcheinandergeworfen werden: Statistiken, Prognosen und Szenarien. Man kann sich den Unterschied zwischen ihnen an Analogien aus der Wetterkunde verdeutlichen.


Statistiken. Daten sind gewissermaßen das Rohmaterial der Meteorologie - Meßwerte von terrestrischen Stationen, heute wesentlich auch Meßwerte, die Wettersatelliten liefern. Täglich werden weltweit Millionen solcher Meßwerte über Temperatur, Luftfeuchtigkeit, Luftdruck usw. gesammelt.

Für sich genommen ist jede dieser Messungen recht wertlos. Erst durch ihre Aufbereitung, durch die Zusammenfassung mit anderen Meßwerten wird sie nutzbar. Es werden Mittelwerte und andere Kennwerte berechnet, es werden Verteilungen dargestellt usw. Das ist die Aufgabe desjenigen Zweigs der Statistik, den man deskriptive Statistik nennt.

Wenn man umgangssprachlich von "einer Statistik" spricht, dann meint man im Allgemeinen einen derart aufbereiteten Datensatz. Es gibt Menschen, denen dazu unweigerlich "Ich glaube nur an die Statistiken, die ich selbst gefälscht habe" einfällt, was Churchill zugeschrieben wird. Nur hat dieser das nie gesagt, sondern der Satz ist ein Produkt des Ministeriums für Volksaufklärung und Propaganda von Joseph Goebbels.

Wo er auch hinpaßt; denn er ist Unfug. Man kann in der deskriptiven Statistik zwar einen Datensatz unterschiedlich aufbereiten, zum Beispiel unterschiedlich große Kategorien bilden. Dadurch kann man den einen oder anderen Aspekt dieses Datensatzes hervorheben. Lügen kann man mit Statistik nicht. Das ist ein dummes Vorurteil. Eben auf dem Niveau von Goebbels.

In der Wetterkunde gibt es solche Statistiken beispielsweise über die langjährige Durchschnittstemperatur an einem Ort, über Regenhäufigkeit usw. Aber auch die Zusammenfassung aller der Daten, die für eine Region an einem einzigen Tag erhoben werden, ist ein Ergebnis deskriptiver Statistik. Man visualisiert sie gewöhnlich als eine Wetterkarte. Hier sehen sie eine solche Karte für die Ostküste der USA, erstellt für den 1. August 1973:



Die dicken Linien sind Isobaren. Sie verbinden Orte gleichen Luftdrucks miteinander. Die Ziffern und Symbole zeigen Meßwerte an den einzelnen Stationen.

Eine solche Wetterkarte sieht anders aus als die Wetterkarten, die wir aus dem Fernsehen kennen. Diese enthalten Symbole wie Sonne und Wolken statt einzelner Meßwerte; es wird über größere geographische Regionen gemittelt usw. Aber die Meßwerte, die in die Wetterkarten auf unseren Bildschirmen eingehen, sind dieselben, die man auch als eine Wetterkarte wie die obige darstellen könnte. Es sind dieselben Daten, nur anders aufbereitet.


Prognosen, Modelle, Szenarien. Eine Karte, auf der die gegenwärtige oder die gestrige Wetterlage zu sehen ist, mag vielleicht für Meteorologen interessant sein, wäre für uns Normalmenschen aber ziemlich unergiebig. Wie das Wetter war und ist, das wissen wir ja. Wir wollen wissen, wie es wird. Wir wollen eine Vorhersage, eine Prognose.

Was wir im Deutschen "Prognose" nennen, dafür gibt es im Englischen drei Wörter: prognosis, prediction und forecasting.

Prognosis ist die medizinische Prognose über einen zu erwartenden Krankheitsverlauf; etwas, das der Arzt in der Regel nur ungenau und aufgrund bestimmter Erfahrungswerte angeben kann.

Prediction ist eine präzisere Vorhersage, der bestimmte Annahmen und Modelle zugrundeliegen können.

Forecasting ist die Bezeichnung für die wissenschaftliche, oft auf komplexen Berechnungen basierende Vorhersage von Entwicklungen beispielsweise in der Ökonomie, in der Technologie, aber etwa auch von Erdbeben oder anderen Ereignissen.

Sie sehen daran, daß "Prognosen" von sehr unterschiedlicher Genauigkeit sein können; wir haben im Deutschen dafür nur dieses eine Fremdwort mit seiner Verdeutschung "Vorhersage".

Um Prognosen zu machen, braucht man in der Regel Modelle. Modelle sind vereinfachte Abbildungen. Ein Modell des Kölner Doms beispielsweise zeigt viele seiner Merkmale; aber nicht jeder Stein, nicht jedes Glasstück eines Mosaiks findet sich in ihm wieder. Viele Modelle sind abstrakter: Sie repräsentieren das Abgebildete nur in Form von mathematischen Ausdrücken.

So ist es zum Beispiel bei Wettermodellen, die im wesentlichen aus einer großen Anzahl von (nichtlinearen) Gleichungen bestehen. Sie drücken aus, wie sich Ausgabegrößen (der "Output") in Abhängigkeit von Eingangsgrößen verändern - sagen wir, die Temperatur an einem Ort in Abhängigkeit von der Sonneneinstrahlung, der Bodenbeschaffenheit usw.

Für eine Prognose versucht man so weit wie möglich reale Meßdaten heranzuziehen. Das ist anders bei einem Szenario, das ansonsten viel Ähnlichkeit mit einer Prognose hat. Hier gibt man aber in ein Modell auch Daten ein, die nur angenommen werden. Ein Beispiel sind die Klimaszenarien, die auf Klimamodellen basieren. Diese sind im Prinzip Wettermodelle, aber auf globaler Ebene.

Wenn man aus ihnen Aussagen über, sagen wir, das Weltklima im Jahr 2050 gewinnen will, dann kann man sich nicht allein - wie bei den Wettermodellen - auf Meßwerte stützen. Man muß vielmehr Annahmen machen; beispielsweise über die Entwicklung des CO2-Ausstoßes, die Ausdehnung des tropischen Regenwalds usw.

Je nachdem, mit welchen Annahmen man das Modell füttert, liefert es das eine oder andere Szenario. Kein Klimamodell sagt vorher, wie sich das globale Klima entwickeln wird. Diese Modelle sagen uns nur, wie es sich - wenn die vielen jeweiligen Modellannahmen stimmen - entwickeln würde.

Zwischen Prognosen und Szenarien gibt es einen fließenden Übergang. Das eine Extrem ist eine Prognose, die überhaupt keine Annahmen enthält, sondern nur auf Daten basiert; man könnte sie eine reine Prognose nennen. Je mehr Annahmen eingehen - je mehr alternative Vorhersagen man also machen kann, je nach Annahmen - , umso mehr wird die Prognose zu einem Szenario.


Statistiken in der Demographie. Ich habe die Demographie einen Augenblick verlassen und einen Blick in die Wetterkunde geworfen, weil ich annehme, daß diese Ihnen geläufiger ist. Wenn Sie das bis hierher Erläuterte verstanden haben, dann können Sie es nun leicht auf die Demographie übertragen. Sie werden im zweiten Teil sehen, wie wichtig diese Unterscheidungen für das Verständnis und die Beurteilung der Thesen Thilo Sarrazins ist.

Demographische Statistiken - also das, was den Wetterdaten entspricht - umfassen große Datenmengen, die ebenso wie die Wetterdaten aufbereitet werden müssen, damit man mit ihnen etwas anfangen kann.

Gesammelt und aufbereitet werden diese Daten in Deutschland beim Statistischen Bundesamt, das Bevölkerungsstatistiken veröffentlicht. Deren Grundlage sind die Daten vor allem von Volkszählungen sowie eines regelmäßigen jährlichen Mikrozensus. Dabei werden die Daten von einem Prozent aller Haushalte erhoben, die repräsentativ für die Gesamtheit der deutschen Haushalte sind.

Was dabei abgefragt wird, geht weit über die reine Zählung der Bevölkerung hinaus und umfaßt zum Beispiel Ausbildung, Berufstätigkeit und dergleichen. Hier können Sie sich einen solchen Fragebogen ansehen.

Thilos Sarrazin analysiert zwar in seinem Buch die Demographie in ihrem Zusammenhang mit anderen Bereichen, vor allem der Ökonomie und der Bildung. Ich beschränke mich jetzt aber auf die demographischen Daten; also die Daten zur Größe und zur Struktur der Bevölkerung in Deutschland.

Wovon hängt die Größe einer Bevölkerung ab? Im wesentlichen von vier Faktoren: Davon, wieviele Kinder pro Frau geboren werden (Geburtenziffer); davon, wieviele Menschen in einem gegebenen Zeitraum sterben (Sterbeziffer); von der Zahl der Einwanderer und schließlich von der Zahl der Auswanderer.

Nehmen wir den einfachsten Fall an: Es gibt keine Ein- und keine Auswanderung und sowohl die Geburtenziffer als auch die Sterbeziffer in einer Bevölkerung sind konstant. Wie sieht dann die Altersstruktur der Bevölkerung aus? Da von jedem Geburtsjahrgang jedes Jahr ein bestimmter Anteil stirbt, aber - der Annahme nach - außer den Neugeborenen niemand hinzukommt, entsteht eine Verteilung in Form einer Pyramide, der sogenannten Bevölkerungspyramide.

Jeder Jahrgang ist weniger kopfstark als der vorausgehende; die "Pyramide" ergibt sich dadurch, daß man links die Daten für die männliche und spiegelbildlich dazu rechts die Daten für die weibliche Bevölkerung aufträgt.

Es gibt Staaten, deren Bevölkerung in der Tat einen solchen Aufbau zeigt, zum Beispiel Niger (hier verstärkt durch die in den vergangenen Jahrzehnten abnehmende Sterblichkeit):



In den meisten Ländern variieren die Geburten- und die Sterbeziffern über die Jahre in Abhängigkeit von diversen Faktoren. Die Sterbeziffer ist beispielsweise in Kriegszeiten erhöht. Die Geburtenziffer ist ebenfalls nicht konstant, sondern ändert sich aufgrund kulturellen und wirtschaftlichen Wandels. Statt einer Bevölkerungspyramide ergibt sich dann eine Verteilung wie diese für Deutschland im Jahr 2010:


Die erhöhte Sterbeziffer im Zweiten Weltkrieg, die noch vor wenigen Jahrzehnten zu "Lücken" in der Bevölkerungspyramide führte, spielt inzwischen faktisch keine Rolle mehr; wer bei Kriegsende zwanzig Jahre oder älter war, der ist inzwischen mindestens 85 Jahre alt. Die Pyramide spiegelt überwiegend die sich ändernde Geburtenziffer wider: Sie lag um 1965 herum am höchsten (bei knapp 2,5 Kindern pro Frau), sank bis Anfang der siebziger Jahre drastisch ab und hat sich jetzt bei ungefähr 1,4 stabilisiert.

Die Folge ist, daß jetzt die Menschen um das Alter von 45 herum besonders zahlreich sind (die "Baby-Boomer"). Zu den Mittdreißigern hin nimmt die Bevölkerung drastisch ab, danach langsamer.

Man muß sich dabei klarmachen, daß bei einer Geburtenziffer unterhalb von dem Wert 2 (in Wahrheit liegt dieser kritische Wert etwas höher als 2) die Bevölkerung auch dann schrumpft, wenn diese Geburtenziffer sich nicht mehr ändert. Denn wenn eine Generation weniger Kinder hat als die vorausgehende, dann hat die nachfolgende auch weniger Frauen, die Kinder gebären können. Dieser Effekt wäre noch drastischer, wenn ihm die Einwanderung nach Deutschland nicht entgegenwirken würde.


Prognosen und Szenarien in der Demographie. Bisher waren wir bei dem, was in der Meteorologie den Wetterdaten entspricht; die Bevölkerungspyramide ist so etwas wie das Gegenstück zur Wetterkarte. Aus den Wetterdaten leiten die Meteorologen ihre Vorhersagen ab, aus Klimadaten die Klimatologen ihre Szenarien. Was entspricht dem in der Demographie?

Ich hatte gesagt, daß es zwischen Prognosen und Szenarien einen fließenden Übergang gibt. Reine Prognosen ergeben sich dann, wenn man sich nur auf Daten stützen kann und keine Annahmen machen muß.

So etwas - das sonst selten ist - gibt es tatsächlich in der Demographie. Denn die Kinder von heute sind die Erwachsenen von morgen.

Wenn wir wissen wollen, wie viele in Deutschland geborene Menschen von 35 Jahren es im Jahr 2040 gibt, dann brauchen wir nur nachzusehen, wie viele 5jährige es jetzt, im Jahr 2010, gibt. Denn es sind ja beide Male dieselben Menschen - eine "Kohorte", wie die Demographen das nennen.

Es wird einen gewissen Schwund durch Auswanderung und Sterblichkeit geben; aber wenn wir diese (nicht sehr bedeutsamen) Faktoren ausklammern oder gute Schätzwerte für sie haben, dann können wir recht exakte Prognosen für die 35jährigen von 2040 machen, die in Deutschland geboren wurden.

Die Kinder von heute sind die Erwachsenen von morgen. Aber die Kinder von morgen kennen wir noch nicht. Eine Aussage darüber, wie viele 25jährige es im Jahr 2040 gibt, ist deshalb ungleich schwerer. Denn diese Menschen sind ja noch nicht geboren.

Wir müssen also Annahmen über die künftige Entwicklung der Geburtenziffer machen. Und damit sind wir nicht mehr bei der reinen Prognose, sondern bei Szenarien.



Sie sehen, lieber Leser, daß wir jetzt wieder bei der aktuellen Kontroverse um Sarrazin angekommen sind.

Sofern er Statistiken präsentiert, können diese nur entweder richtig sein oder fehlerhaft; also zum Beispiel falsch kopiert oder unrichtig berechnet.

Sofern er Prognosen macht, können diese durch die existierenden Daten abgedeckt sein (wie im obigen Beispiel der 35jährigen im Jahr 2040) oder nicht.

Sofern er aber Szenarien entwirft, ist es vom Ansatz her verfehlt, diese als "richtig" oder "falsch" zu bezeichnen. Zu untersuchen ist vielmehr, ob die Annahmen, die in ein solches Szenario gesteckt werden, plausibel oder unplausibel sind.

In der Kritik, die man an Sarrazin geübt hat, ist das meist durcheinandergegangen, oft auf eine fürchterliche Weise durcheinandergegangen. Nach dem, was ich jetzt erläutert habe, wird es relativ leicht sein, im zweiten Teil sachlich zu prüfen, wie Sarrazins Aussagen aus wissenschaftlicher Sicht zu beurteilen sind.



Links zu allen Folgen dieser Serie finden Sie hier.



© Zettel. Für Kommentare bitte hier klicken. Titelvignette von der Autorin Nina unter Creative Commons Attribution-Share Alike 3.0 Unported-Lizenz freigegeben. Bearbeitet. Abbildungen Wetterkarte und Bevölkerungspyramide Nigeria: Als Werke der Regierung der USA in der Public Domain. Bevölkerungspyramide Deutschland: Vom Autor Lenny222 unter Creative Commons Attribution 3.0 Unported-Lizenz freigegeben.