Appendix 3 – Datenbeschreibung und Methodologie

Kinder machen den Unterschied: Warum der Gender Pay Gap eigentlich ein Motherhood Pay Gap ist.

Download PDF

  • Die Berechnungen in der Studie „Kinder machen den Unterschied“ basieren auf der Arbeitsmarktdatenbank des Hauptverbandes der Sozialversicherungsträger. Diese enthält ab Mitte der 1990er Jahre die komplette und anonymisierte Beschäftigungshistorie aller Personen, die in Österreich sozialversichert sind oder waren.
  • Die Datenbank enthält auch für jede sozialversicherte Person die entsprechende Information über die individuelle tagesgenaue Beitragsgrundlage (d.h. Bruttoeinkommen). Darüber hinaus werden verschiedene Karriere-Unterbrechungen, wie etwa der Bezug von Wochengeld, Kinderbetreuungsgeld oder beispielsweise Perioden der Arbeitslosigkeit vermerkt.
  • Verschiedene personenbezogene Merkmale, die zusätzlich verwendet werden: Staatsbürgerschaft, Geburtsjahr bzw. Alter, Geschlecht, akademischer Titel (ine detaillierte Bildungsinformation ist nicht vorhanden), Wirtschaftsbranche, in der eine Person arbeitet und der Bezirk, in dem eine Person tätig ist. Leider steht uns der Familienkontext (etwa Existenz anderer Kinder oder Einkommen des Partners) nicht zur Verfügung.
  • Die verwendete Datenbank ist keine Stichprobe, sondern beschreibt alle Versicherungsfälle. In Summe stehen ungefähr 150 Millionen Episoden zur Verfügung. Um eine möglichst hohe Vergleichbarkeit zu gewährleisten, beschränken wir uns jedoch auf Personen, die außerhalb des Karenzurlaubs als Angestellte oder Arbeiter beschäftigt sind (also keine Beamten, keine Personen in Ausbildung, keine Pensionisten, keine Selbständigen usw.). Nach der Entfernung mangelhafter Daten ergibt sich folgende Anzahl der analysierten Personen:
  • Lohnepisoden definieren sich als Personen-Jahre-Beobachtungen. Im Falle eines Status- oder Jobwechsels innerhalb eines Jahres dient jener Status oder Arbeitgeber als Ausgangspunkt, an dem die Person die Mehrheit des Jahres verbracht hat. Durchschnittlich beobachten wir eine Person über 15 Jahre, maximal jedoch 20 Jahre.
  • In der analysierten Periode zwischen 1997 und 2017 haben 27.000 Männer und fast 200.000 Frauen Eltern-Karenz in Anspruch genommen (es wurden nur vollständige Information ausgewertet). Somit verfügen wir über etwa 350.000 Beobachtungen über die Einkommen-Niveaus der Männer und fast 3,3 Millionen Einkommen-Niveaus der Frauen, die in der Karenz waren. Etwa ein Viertel der Frauen und drei Viertel der Männer können mindestens fünf Jahre vor der Karenz beobachtet werden. Demgegenüber können mehr als 150.000 Frauen und 10.000 Männer mindestens fünf Jahre danach beobachtet werden.
  • Die Datenbank erhält Informationen über die Beitragsgrundlagen in Schilling vor 2001 und ab 2002 in Euro. Daher wird eine über die Zeit vergleichbare Umrechnung benötigt – alle Werte werden zuerst in US-Dollar umgerechnet und dann in Euro (Preisniveau von 2017). Somit berücksichtigen wir die Kursschwankungen über die Jahre sowie Änderungen im allgemeinen Preis-Niveau. Die präsentierten Änderungen entsprechen daher immer Realzuwächsen.
  • Wir analysieren die Entwicklung des Einkommens zwischen Personen, die in Karenz waren (Test-Gruppe) und solchen, die es in der beobachteten Periode nicht waren (Kontroll-Gruppe). Es muss daher die Möglichkeit gegeben sein, festzustellen, wie sich die Einkommen der Personen, die nie in Karenz waren, entwickelt hätten, wenn sie eine Karenzpause gemacht hätten. Dazu „simulieren“ wir Placebo-Karenzzeiten für die Kontroll-Gruppe. Aus der Karenz-Gruppe berechnen wir, unter Berücksichtigung der sozio-ökonomischen Charakteristiken, das typische Alter und die Dauer der Karenz. Anhand dieser berechneten Wahrscheinlichkeiten weisen wir der Kontroll-Gruppe Karenzzeiten zu, die im zweiten Schritt mit den Entwicklungen in der Test-Gruppe verglichen werden. Diese Methode wird beispielsweise auch in einer Studie von Kleven et al. (2018) eingesetzt.
  • Da die Karenz in verschiedenen Jahren in Anspruch genommen wurde, benötigt es eine Normalisierung über die Jahre. Das garantiert, dass makroökonomische Faktoren keine Rolle spielen. Wir beschreiben also die Entwicklungen immer relativ zu dem vorletzten Jahr vor der Karenz (Jahr -2). Diese Wahl entsteht aufgrund der Datenerfassung: Im letzten Jahr vor der Karenz bekommen vor allem Frauen über mehrere Wochen Wochengeld. Diese werden in der Datenbank als Perioden der Karenz erfasst. Die restlichen Monate werden mit dem vollen Lohn ausgewiesen. Weil die Daten auf Jahresebene präsentiert werden,sinkt das Einkommen statistisch gesehen bereits vor der Karenz.
  • Die präsentierten Statistiken für die Karenz-Annahme der Frauen basieren auf zwei verschiedenen Schätzungen. Erstens wird eine sogenannte Difference-in-Differences-Gleichung (Diff-in-Diff) geschätzt, in der die Gruppen der Eltern und Nicht-Eltern verglichen werden.
  • Diese Methode vergleicht den Verlauf zweier Gruppen (der Personen), bei denen sich die Löhne vor der Karenz ähnlich entwickelt haben. Danach ist eine dieser Gruppen in die Karenz gegangen und seitdem entwickelt sich ihr Einkommen eben anders. Die Methode berechnet demnach den Unterschied zwischen den Einkommen der zwei Gruppen nachdem eine Gruppe in die Karenz eingetreten ist.
  • Durch diese Methode wird  nicht nur das Alter der betroffenen Personen berücksichtigt (die Seniorität ist aufgrund der nicht allzu häufigen Jobwechsel eine relativ gute Annäherung  für die Berufserfahrung), sondern auch makroökonomische Entwicklungen. Wir betrachten in dieser Berechnung sowie den folgenden statistischen Verfahren ausschließlich Personen, die wir fünf Jahre vor und zehn Jahre nach der Karenz beobachten können.
  • Die Gültigkeit dieser Berechnungen basiert auf der Annahme, dass sich karenzierte Personen nicht mit nicht-karenzierten Personen vergleichen lassen. Für die Gültigkeit der Diff-in-Diff-Methode reicht es, dass die Trends über die Zeit vor der Karenz vergleichbar waren (z.B.: Die Steigungsraten des Einkommens, nicht unbedingt deren genaue Höhe). Während das bei den Frauen durchaus der Fall ist, lässt sich dasselbe nicht über die Väter sagen, die in Karenz gehen. Männer, die in die Karenz gehen, haben prinzipiell andere Charakteristika als der Durchschnitt. Für diesen Fall verwenden wir ein zweites statistisches Verfahren, die so genannte synthetische Kontrolle. In diesem Verfahren werden „künstliche“ Personen mit Charakteristika der Durchschnittspopulation konstruiert, die dann weiter untersucht werden. So werden aus der Gesamtheit aller karenzierten Frauen die jeweiligen Gegenparts nachgebildet: synthetische nicht-karenzierte Männer für einen Mann-Frau-Vergleich oder synthetische nicht-karenzierte Frauen für einen Vergleich der beiden Frauengruppen. Um karenzierte Männer mit karenzierten Frauen vergleichen zu können, werden die synthetischen karenzierten Männer ebenfalls aus der Gesamtheit aller karenzierten Frauen entwickelt. 
"Grafik der Woche" abonnieren

Jetzt anmelden und jeden Montag die beliebte Grafik der Woche mit erhellenden Daten, Fakten und aktuellen Analysen aus Wirtschaft und Politik erhalten.

Immer up-to-date

GRAFIK DER WOCHE & NEWSLETTER

Wissen was passiert: Unsere "Grafik der Woche" bekommen Sie pünktlich jeden Montag, außerdem informieren wir Sie über aktuelle Events, Vorträge, Themen in unserem Umfeld.

Sie sehen gerade einen Platzhalterinhalt von Google reCAPTCHA. Um auf den eigentlichen Inhalt zuzugreifen, klicken Sie auf den Button unten. Bitte beachten Sie, dass dabei Daten an Drittanbieter weitergegeben werden.

Weitere Informationen '
'

Mit dem Absenden des Formulars nehmen Sie die Datenschutzerklärung zur Kenntnis. Datenschutzhinweise und Cookiebestimmungen

NEWSLETTER
Vielen Dank für Ihre Anmeldung! Sie erhalten nun eine Bestätigungs-E-Mail (bitte prüfen Sie auch Ihren Spam-Ordner) mit einem Link zur Bestätigung der Anmeldung.
Sollte sich Ihre E-Mail-Adresse bereits in unserem System befinden, erhalten Sie stattdessen eine E-Mail mit einem Link um Ihre Einstellungen anzupassen.

Immer up-to-date

ANMELDUNG ZU VERANSTALTUNGEN

Sie sehen gerade einen Platzhalterinhalt von Google reCAPTCHA. Um auf den eigentlichen Inhalt zuzugreifen, klicken Sie auf den Button unten. Bitte beachten Sie, dass dabei Daten an Drittanbieter weitergegeben werden.

Weitere Informationen '
'

Mit dem Absenden des Formulars nimmst Du die Datenschutzerklärung zur Kenntnis. Datenschutzhinweise und Cookiebestimmungen

ANMELDUNG ZU VERANSTALTUNGEN
Vielen Dank für Deine Anmeldung! Du erhältst nun eine Bestätigungs-E-Mail (bitte prüfen auch Deinen Spam-Ordner) mit einem Link zur Bestätigung der Anmeldung.
Sollte sich Deine E-Mail-Adresse bereits in unserem System befinden, erhältst Du stattdessen eine E-Mail mit einem Link um Deine Einstellungen anzupassen.

Immer up-to-date

Jetzt zum Newsletter anmelden
und ein kostenloses Exemplar der Grafiksammlung erhalten!

Sie sehen gerade einen Platzhalterinhalt von Google reCAPTCHA. Um auf den eigentlichen Inhalt zuzugreifen, klicken Sie auf den Button unten. Bitte beachten Sie, dass dabei Daten an Drittanbieter weitergegeben werden.

Weitere Informationen '
'

Mit dem Absenden des Formulars nehmen Sie die Datenschutzerklärung zur Kenntnis. Datenschutzhinweise und Cookiebestimmungen

NEWSLETTER
Vielen Dank für Ihre Anmeldung! Sie erhalten nun eine Bestätigungs-E-Mail (bitte prüfen Sie auch Ihren Spam-Ordner) mit einem Link zur Bestätigung der Anmeldung.
Sollte sich Ihre E-Mail-Adresse bereits in unserem System befinden, erhalten Sie stattdessen eine E-Mail mit einem Link um Ihre Einstellungen anzupassen.

Agenda Austria – der erste unabhängige Thinktank Österreichs.

Gegründet um das Land in wirtschaftlichen und gesellschaftspolitischen Belangen zu öffnen und neue Antworten auf die großen Herausforderungen zu liefern.

Lernen Sie uns kennen