Navigation überspringen


Datenangebot | Lohn- und Einkommensteuerstatistik 2001

Anonymisierung | Metadaten | Ansprechpartner

 

Scientific-Use-File zur Off-Site-Nutzung

Mit FAST 2001 veröffentlicht die amtliche Statistik zum zweiten Mal Mikrodaten aus dem Bereich der Steuerstatistiken in Form von "Faktisch anonymisierten Daten aus der Lohn- und Einkommensteuerstatistik 2001 (FAST 2001)". Diese Daten bieten der Wissenschaft die Möglichkeit, politisch relevante Fragestellungen zum Steuer- und Transfersystem auf der Grundlage echter Veranlagungsdaten am eigenen Arbeitsplatz zu analysieren.

Die Datei ist eine Stichprobe mit einem Umfang von zehn Prozent aus den Einzeldaten der Einkommensteuerstatistik des Veranlagungsjahres 2001. Die knapp drei Millionen Datensätze und über 600 Merkmale enthalten umfangreiche Informationen aus dem Besteuerungsverfahren, von den Einkommensquellen bis zur festgesetzten Einkommensteuer. Darüber hinaus sind Angaben zu Alter, Geschlecht, Familienstand und Kinderzahl enthalten.

FAST 2001 weist eine Reihe von Merkmalen auf, die eine gezielte Analyse über Einkommensverteilungen für gesellschaftliche Gruppen ermöglicht. Beispielhafte Merkmale sind: Religion, Veranlagungsart, Grund-/Splittingtabelle, Steuerklasse, Wirtschaftszweig, Zugehörigkeit zu den Freien Berufen und regionale Zuordnung der Steuerpflichten. Die einzelnen Datensätze enthalten Angaben über einen Steuerpflichtigen, der im Fall der gemeinsamen Veranlagung von Ehegatten zwei Personen beschreibt.

FAST 2001 ermöglicht Auswertungen nach dem Besteuerungsschema gemäß § 2 EStG über die einzelnen Einkunftsarten, Einkommen, zu versteuerndes Einkommen bis hin zur Steuerschuld des Steuerpflichtigen. Auch wenn bei der Anonymisierung größten Wert auf den Erhalt des Analysepotentials gelegt wurde sind nicht alle Fragestellungen der Wissenschaft exakt mit den Daten analysierbar. Unter Berücksichtigung dieser Einschränkung ist ein umfangreiches Datenmaterial aus der Lohn- und Einkommensteuerstatistik für die Wissenschaft mit geringen Kosten für steuerliche Analysen zugänglich.

 

Anonymisierungsmaßnahmen

Die Ausgangsdatenbasis für die FAST-Datei ist eine 10-Prozent-Stichprobe aus der rund 30 Millionen Einzeldatensätze umfassenden Grundgesamtheit aller Einkommensteuerpflichtigen. Hierbei handelt es sich um eine optimierte Stichprobe, die in erster Linie nach dem Gesamtbetrag der Einkünfte geschichtet ist.

Als allgemeine Anonymisierungsmaßnahmen sind Merkmale vergröbert oder gelöscht worden. Spezifische Anonymisierungsmaßnahmen sind in Abhängigkeit der Höhe des Gesamtbetrags der Einkünfte vorgenommen worden, wobei für die Extrembereiche eine stärkere Anonymisierung als für mittlere oder niedrige Bereiche durchgeführt wurde. Hierfür wurden verschiedene Anonymisierungsklassen gebildet, für die unterschiedlich starke Anonymisierungsmaßnahmen vorgenommen worden sind.

Seitenanfang

 

Metadaten zum Download

Datei Format Größe
Dokumentation Off-Site-Datensatz
der Lohn- und Einkommensteuerstatistik 2001
(komplett mit Anlagen)
zip 427 KB

oder als einzelne Dateien:

Datei Format Größe
Anonymisierungskonzept pdf 233 KB
Datensatzbeschreibung pdf 122 KB
Literaturverzeichnis pdf 99 KB
Stichprobenrahmen pdf 134 KB

(Stand: 04. Juli 2007)

Weitere Quellen für Metadaten:

Seitenanfang

 

Ansprechpartner

Falls Sie weitere Fragen zum Scientific-Use-File haben, wenden Sie sich bitte an einen der Standorte der Forschungsdatenzentren der Statistischen Ämter des Bundes und der Länder oder direkt an:

Ansprechpartner Telefon E-Mail
Heike Habla
Statistisches Bundesamt
FDZ des Statistischen Bundesamtes
0611 75-3277 forschungsdatenzentrum@destatis.de
Sebastian Scharnhorst
Information und Technik NRW
FDZ der Statistischen Landesämter
0211 9449-2873 forschungsdatenzentrum@it.nrw.de

Seitenanfang