istock.com/weible1980
Theorie | 10.05.2019 (editiert am 14.05.2019)

Schuldenquoten, Wachstumsraten und die Wissenschaft

Noch steht das Dogma der schwarzen Null. Aber über ihre Sinnhaftigkeit wird zunehmend diskutiert. Richtig so, denn der behauptete negative Zusammenhang zwischen der Höhe von Schuldenquoten und Wachstumsraten steht auf tönernen Füßen.

Seit amerikanische Top-Ökonomen der Welt erklären, dass hohe Schulden unter bestimmten Umständen absolut kein Problem darstellen, hat sich auch in Deutschland eine Debatte über Staatsschulden entwickelt. Auch die überschwappende MMT-Diskussion trägt zweifellos dazu bei, die Sinnhaftigkeit von Schuldenbremsen infrage zu stellen. Zwar wehren sich die sogenannten Leitmedien hierzulande und die meisten deutschen Politiker noch dagegen, unbestreitbare logische Zusammenhänge in einer Geldwirtschaft anzuerkennen. Doch, wenn auch langsam, scheint es, als beginne auch die intellektuelle Fassade der ordoliberalen Bastion ein wenig zu bröckeln.

Fast genau 10 Jahre ist es her, seit Carmen Reinhart und Kenneth Rogoff in eine der einflussreichsten ökonomischen Zeitschriften der Welt ihre berühmte Analyse „Growth in a Time of Debt“ veröffentlichten. Darin gaben sie vor zu zeigen, dass das Wirtschaftswachstum dramatisch einbricht, sobald der Schuldenstand eines Landes 90 Prozent des Bruttoinlandsprodukts übersteigt. Dieses Papier wurde fortan überall dazu benutzt, um die Durchsetzung radikaler Austeritätsmaßnahmen zu rechtfertigen.

In diesem Stück wird es nicht vorrrangig darum gehen, die theoretische Fundierung der Analysen von Reinhart und Rogoff zu hinterfragen. MAKROSKOP-Leser wissen, dass es in einer Welt sparender Unternehmen,  keine andere Möglichkeit gibt, als dass der Staat sich verschuldet – ganz gleich wie hoch der Schuldenstand sein mag ,will man nicht eine Volkswirtschaft in eine wirtschaftliche Katastrophe treiben. An diesem grundsätzlichen und logischen Zusammenhang lässt sich nicht rütteln. Dennoch mag es hilfreich sein zu zeigen, dass selbst dann, wenn man diese Zusammenhänge bestreitet, die methodischen Schwächen der Reinhart-Rogoff Analyse, die andere vermeintlich empirisch arbeitende Sozialwissenschaften weithin teilen aufzuzeigen.

Replikationskrise

Zunächst einmal sind es natürlich nicht methodische Schwächen, sondern zweifelhaften Berechnungsmethoden, die Reinhart und Rogoffs „empirischen Beleg“ der schädlichen Wirkung „zu hoher Staatsschulden“ diskreditiert haben. Offengelegt wurden diese durch einen Masterstudenten der University of Massachusetts Amherst, Thomas Herndon, dessen Forschungsergebnisse auch medial große Wellen schlugen. In einem Ökonometriekurs wurde Studenten von Amherst die Aufgabe gestellt, sich eine ökonometrische Studie auszusuchen und deren Ergebnisse zu replizieren. Aufgrund der Bedeutung des Reinhart-Rogoff Papiers entschloss sich Herndon, die recht simple Methodik von Reinhart und Rogoff nachzuarbeiten und seine eigenen Ergebnisse mit den veröffentlichten Werten zu vergleichen. Was eine Arbeit von nur wenigen Stunden sein sollte, zog sich dann über mehrere Wochen hin, weil es weder Thomas Herndon noch seinen Professoren gelang, auf die dieselben Ergebnisse wie Reinhart und Rogoff zu kommen.

Nachdem Reinhart-Rogoff auf mehrfache Nachfrage hin die Daten mit den Forschern teilten, konnten letztere feststellen, dass die renommierten Professoren auf eine sehr seltsame beziehungsweise schlampige Weise zu ihren Ergebnissen gelangten. Die Replik zu Reinhart und Rogoffs Papier wurde im Cambridge Journal of Economics veröffentlicht und belegt, dass die beiden renommierten Ökonomen öffentlich zugängliche Daten für gewisse Zeiträume nicht verwendet oder nur sehr selektiv mit einbezogen. So wurden zum Beispiel die Daten der USA in der Nachkriegszeit (wirtschaftliche Kontraktion und Schuldenquote > 90 Prozent) mitberücksichtigt, während die Daten von Ländern wie Australien, Neuseeland, oder Kanada (hohe Wachstumsraten und durchgehende Schuldenstände > 90 Prozent) im selben Zeitraum mit dem Argument sie fielen ins „Cluster der Nachkriegszeit“ ignoriert wurden. Darüber hinaus haben Reinhart und Rogoff in ihren Berechnungen unbeabsichtigt die in alphabetischer Reihenfolge ersten fünf Länder (Australia, Belgium, Canada und Denmark) nicht entsprechend importiert und daher bei der Berechnung nicht berücksichtigt.

Als ein weiteres Problem stellte sich die Gewichtung der Daten der einzelnen Länder heraus.  Die Interpretation der Ergebnisse beruht auf einer Analyse, die sich auf die durchschnittliche und mittlere (Median) Wachstumsraten einzelner[1] Länder innerhalb der jeweiligen Schuldenquotenkategorie beziehen. Reinhart und Rogoff hatten Länder nach der Höhe ihrer Schuldenquoten in vier Kategorien unterteilt: Solche mit Schuldenquoten von (1) < 30 Prozent, (2) 30-60 Prozent, (3) 60-90 Prozent und (4) > 90 Prozent. Innerhalb dieser Kategorien werden dann die Durchschnitts- beziehungsweise Medianwerte insgesamt ermittelt, aus denen dann wiederum der Durchschnitt beziehungsweise Median für alle Länder berechnet wird. Das ist eine höchst problematische Vorgehensweise, weil dadurch ein Land über den untersuchten Zeitraum in unterschiedlichen Kategorien mehrmals auftauchen kann.

Um es an einem Beispiel festzumachen: Großbritannien taucht insgesamt mit 19 mal, Neuseeland dagegen nur ein einziges Mal, nämlich im Jahr 1951 in Kategorie (4) auf. Großbritanniens durchschnittliches Wirtschaftswachstum in (4)  liegt bei 2,4 Prozent, Neuseeland dagegen lag bei -7,6 Prozent. Reinhart und Rogoff gewichten beide Werte gleich, obwohl der Wert für Großbritannien auf Basis von insgesamt 19 Zeitpunkten ermittelt wurde, während der Wert Neuseelands auf der Erfahrung eines einzigen Jahres basiert.

Bleiben wir bei unserem Großbritannien-Neuseeland Beispiel, so hieße dies, dass das durchschnittliche Wachstum für alle Länder in der vierten Kategorie bei -2,6 Prozent läge, womit der behauptete (negative) Zusammenhang zwischen Schuldenquoten und Wirtschaftswachstum „belegt“ worden wäre.  Es versteht sich von selbst, dass eine solche Gewichtung der Daten nicht zulässig ist. Vermeidet man diesen Fehler so haben Herndon et al. gezeigt, ergibt sich zwar weiterhin ein negativer Zusammenhang zwischen Wachstum und Schuldenquote, aber sie sind bei weitem nicht so dramatisch, wie das auf Basis der Berechnungen von Reinhart und Rogoff den Anschein hat. insgesamt negativ bleibt.

Abb. 1: Reales BIP Wachstum (Y) und Schuldenquote (X), links 1946-2009 (Herndon et al., 2013, p. 273); rechts 1790-2009 (ibid., p.274)

Ökonometrische Analysen – so rigoros und überzeugend sie daherkommen mögen – hängt letztendlich enorm stark von subjektiven Meinungen und den Annahmen des jeweiligen Forschers ab. Wenn jemand unbedingt einen bestimmten Zusammenhang finden will, dann kann und wird man das Modell so „feintunen“ können, dass am Ende auch das gewünschte Ergebnis herauskommt. Tatu Westling, zum Beispiel, „belegte“ mithilfe eines Solow Modells, dass die durchschnittliche Penisgröße in einem Land ein gewichtigerer Faktor für das BIP-Wachstum zwischen 1960 und 1985 war, als die Merkmale der politischen Institutionen der untersuchten Länder.

In einigen Bereichen, vor allem in der Psychologie und Medizin, hat sich eine große Replikationskrise verfestigt. Unzählige Studien kommen, sobald sie repliziert werden – also mit demselben Datensatz und derselben Methodik nochmals durchgeführt werden –, zu vollkommen anderen Ergebnissen.

Andere Methodik, andere Ergebnisse

Der wichtigste Faktor bei der Beurteilung ökonometrischer Arbeiten ist und bleibt die zugrundeliegende Theorie. Thomas Herndons Neugier, Reinharts und Rogoffs Analyse zu replizieren, kam auch daher, dass ihn die Arbeit auch aus theoretischer Perspektive nicht überzeugte.

Darüber hinaus sind die verwandten statistischen Verfahren auf Herz und Nieren zu überprüfen. Herndon und seine Professoren haben sich in ihrer Replikationsstudie logischerweise an den Datensatz und die Methodik der Arbeit von Reinhart und Rogoff angeschlossen. Es ist jedoch durchaus fragwürdig, ob der Zusammenhang zwischen Wirtschaftswachstum und Schuldenquoten allein mit dem Verweis auf Durchschnitts- oder Medianwerte sinvoll untersucht werden kann. Selbst Reinhart und Rogoff wiesen darauf hin, dass die Datenpunkte erheblich je nach den betrachteten Ländern und Zeitpunkten um den Durchschnittswert von diesem Wert abweichen. Es finden sich in allen der vier Kategorien Länder und Zeiträume sehr hohen als auch sehr niedrigen Wachstumsraten.

Allein diese Tatsachen sind ein Hinweis darauf, dass die Erklärung der Entwicklung des realen Bruttoinlandsprodukt allein mit Hinweis auf die Höhe der staatlichen Schuldenquoten zumindest unzureichend ist. Ein Problem, wenn man nur mit Durchschnittswerten arbeitet, ist, dass solche zusätzlichen Bestimmungsfaktoren einfach unter den Tisch fallen. Zudem ist es bei einer solchen Vorgehensweise und der gegebenen Fragestellung sehr umständlich bis unmöglich herauszufinden, inwiefern sich die Beobachtungen von Land zu Land unterscheiden.[2]

Was ändert sich nun, wenn wir die Annahme, dass die Schuldenqupoten sich in jedem Land gleichermaßen auf dessen Wirtschaftswachstum auswirken, ein wenig lockern? Wie ändert sich das Ergebnis, wenn wir annehmen, dass der Effekt von Land zu Land unterschiedlich sein kann? Dazu braucht man sogenannte Multilevel- beziehungsweise Random-Effects Regressionsmodelle, da diese Modelle Unterschiede zwischen den Gruppen herausarbeiten können. Andrew Bell, Ron Johnston und Kelvyn Jones) haben uns 2015 auf Basis der Reinhart-Rogoff Daten diese Arbeit abgenommen. Ihre Befunde sind eindeutig: Die Unterschiede von Land zu Land sind viel zu groß, als dass man daraus auf eine Goldene Schuldenregel schließen lassen könnte.

Abbildung 2 zeigt die vom Modell geschätzten Effekte des Schuldenstands auf das Wachstum des jeweiligen Landes. Wenn nun auf dieser Grundlage Austeritätspolitik betrieben werden sollte – wie es in den Fällen der USA, der EU und Großbritanniens passierte –, würde dies einer Art Russisch Roulette gleichen, da höhere Schuldenstände in einigen Ländern anscheinend zu mehr Wachstum führen.

Abb. 2: Schätzungen des BIP Wachstums (Bell et al., 2015, S. 463)

Bei der Betrachtung der Ergebnisse ist es wichtig zu berücksichtigen, dass dieses Modell nur die Effekte des Schuldenstands auf das Wachstum schätzt. Wenn die Schätzungen dieser präziseren Methodik ebenfalls mit den tatsächlich beobachteten Werten nicht übereinstimmen (so hat Japans Schuldenstand mit mehr als 250 Prozent zum BIP immer noch nicht zu einem Kollaps geführt) bedeutet dies, dass irgendwas an den theoretischen Grundlagen der ökonometrischen Analysen Reinharts und Rogoffs fundamental falsch ist.

Noch deutlicher werden die Probleme der ursprünglichen Analyse, wenn Bell et al. die Zeittrend-Effekte kontrollieren. Das heißt in diesem Zusammenhang, dass die Forscher den isolierten Effekt des Schuldenstandes untersuchen wollen und dafür den Einfluss langfristiger, struktureller Veränderungen auf das Wachstum und/oder den Schuldenstand selbst „herausrechnen“ müssen, die nichts mit der im Modell angenommenen kausalen Beziehung zu tun haben. Sparende Unternehmen können eine solche langfristige, strukturelle Veränderung darstellen. Durch die zusätzliche Kontrollvariable erklärt das Modell die vorliegenden Daten deutlich besser (das heißt, der „fit“ wird besser). Es verschwindet sogar der durchschnittlich signifikante Einfluss des Schuldenstands auf das Wachstum, auf den Reinhart und Rogoff so stolz waren. Irland, die USA und Japan bleiben die einzigen Länder aus der gesamten Stichprobe, die noch halbwegs zu dem behaupteten Zusammenhang zwischen Wirtschaftswachstum und Schuldenquoten passen.

Abb. 3: Schätzungen des BIP Wachstums inkl. Zeittrends als Kontrollvariable (Bell et al., 2015, S. 463)

Doch nebst dem logischen Problem, dass der Staat als Schuldner agieren muss, wenn der gesamte Privatsektor spart (es sei denn, man betreibt Merkantilismus) und man einen Wirtschaftsabschwung vermeiden will, stellen sich weitere Fragen im Zusammenhang mit der behaupteten Verbindung von Wachstumsraten und Schuldenquoten: Wie sinnvoll ist es, einen Quotienten einerseits aus einer Bestandsgröße (Schuldenhöhe) und andererseits einer Stromgröße (BIP) zu bilden und dann damit die Entwicklung der Stromgröße selbst erklären zu wollen? Muss man statt der Bruttoschulden nicht auch die Nettoschuldenpositionen in Rechnung stellen? Muss man nicht fragen, wofür die aufgenommen Kredite verwandt wurden, ob zum Beispiel nun für Transferzahlungen oder öffentliche Investitionen? Muss man daher nicht auch vielleicht den Staatsschulden die Staatsvermögen gegenüberstellen?

Fragen, über die man sich in der Forschung und Politik zweifelsohne mehr Gedanken machen sollte, anstatt auf Basis fragwürdiger „empirischer Untersuchungen“ ganze Volkswirtschaften ins Chaos zu stürzen.


[1] Falls einigen Lesern der Unterschied zwischen Durchschnitt und Median nicht bekannt sein sollte: Der Durchschnitt ist einfach der Wert, der sich aus der Summe aller Beobachtungen geteilt durch die Anzahl der Beobachtungen ergibt (Bsp: aus den Werten 3, 5 und 10 ist der Durchschnitt = 6). Der Median hingegen ist einfach der mittlere Wert, wenn alle Werte in geordneter Reihenfolge aufgelistet werden. Aus den Werten 3, 5 und 10 ist der mittlere Wert somit = 5.
[2] Streng genommen könnte man für jedes Land einzeln eine Regression durchführen oder aber entsprechende zusätzliche Parameter in das Modell hinzufügen. Dies macht es allerdings unmöglich, die Effekte der zeitinvarianten Ländercharakteristika zu messen, da sämtliche Freiheitsgerade aufgebraucht werden. Auch mit dem sog. Shrinkage haben lineare Paneldatenmodelle ihre Probleme. Für das allgemeine Verständnis dieses Artikels sind diese technischen Details nicht relevant. Für diejenigen, die es interessiert, ist der Artikel „Explaining Fixed Effects: Random Effects Modeling of Time-Series Cross-Sectional and Panel Data“ von Bell und Jones (2015) sehr zu empfehlen (hier).

Anmelden