1. Einleitung

Bisher haben wir uns mit den unterschiedlichen Objekte und Objektklassen in R auseinandergesetzt. In der zweiten Sitzung gingen wir dabei auf zweidimensionale Objekte und auf die Arbeit mit Datensätzen ein. In dieser dritten und der kommenden vierten Sitzung wollen wir unsere Kenntnis der Arbeit mit Datensätzen vertiefen, indem wir externe Datensätze einladen und zur Handhabung aufbereiten. Dabei lernen wir die Datensätze kennen, mit denen wir im weiteren Verlauf des Kurses arbeiten werden.

2. Externe Datensätze einladen

Nur wenige Forschende haben die Ressourcen, sämtliche für ihre Analyse notwendigen Daten eigenständig zu erheben. Das gilt umso mehr für Studierende. Deshalb ist es essentiell zu wissen, wie Sekundärdaten (Daten, die andere Forschende zur Verfügung stellen) für die eigene Datenanalyse nutzbar gemacht werden können. Diese stehen in Form von Datensätzen in unterschiedlichen Datenformaten zur Verfügung. R, bzw. einige Pakete, bieten vierschiedene Möglichkeiten an, Datensätze in unterschiedlichen Formaten zur Analyse zu laden.

2.1 GLES 2017

Um zu Erlernen, auf welchem Wege man üblicherweise an Forschungsdaten gelangt, wollen wir in einem ersten Schritt öffentlich verfügbare Daten herunterladen und von der eigenen Festplatte laden. Besuchen Sie dazu den Web-Auftritt des Leibniz Instituts für Sozialwissenschaften unter https://www.gesis.org/home. Die Gesis bietet einen großen Fundus an sozialwissenschaftlichen Daten, der Ihnen auch über den Kontext dieses Kurses hinaus an die Hand gegeben sei. Hier finden Sie eine Reihe relevanter Forschungsdaten wie den ALLBUS und das SOEP.

Suchen Sie aber die Suchleiste nach dem “Nachwahl-Querschnitt (GLES 2017)”. Die German Longitudinal Election Study (GLES) ist ein Projekt der Gesis in Kooperation mit der Deutschen Gesellschaft für Wahlforschung (DGfW). Sie vereint Vor- und Nachwahlbefragungen einer repräsentativen Stichprobe der Wählerschaft bei Bundestagswahlen. Der hier verwendete Nachwahl-Querschnitt befragte die Respondenten im Nachgang der Bundestagswahl 2017 zu politischen Themen, Einstellungen und Verhaltensweisen, Meinungsbildung im Wahlkampf sowie sozio-demografischen Merkmalen. Insbesondere ist es uns damit möglich, die Wahlentscheidung der Befragten zu analysieren bzw. Einflussfaktoren der Wahl einer bestimmten Partei zu bestimmen.

Laden Sie sich rechts oben unter “Downloads” -> “Datensätze” die Version “ZA6801_de_v4-0-1.sav deutsch (Datensatz)” mit 2.37 MB herunter. Dazu werden Sie aufgefordert, sich ein Konto bei der Gesis anzulegen. Laden Sie sich bitte außerdem unter “Fragebögen” den Fragebogen “ZA6801_fb.pdf deutsch” und unter “andere Dokumente” die Studienbeschreibung “ZA6801_sb.pdf” herunter und machen Sie sich mit beidem vertraut. Das ist wichtig, um einen Überblick über die Studie, den Datensatz und die vercodete Information bzw. insbesondere die vorhandenen Variablen und damit verbundenen Interviewfragen zu bekommen. Die Variablennamen sind technisch gehalten und an sich wenig aussagekräftig, weshalb die Begleitdokumentation wesentlich ist, um zu verstehen, welche inhaltliche Information dahinter steckt.

Legen Sie den Datensatz an einer geeigneten Stelle auf ihrem Computer ab. Am besten ist es, wenn Sie sich einen Ordner zu diesem Seminar anlegen, in dem Sie den Datensatz, die Begleitdokumentation und die Kursskripte speichern. Um den Datensatz nun in R zu laden, müssen wir zunächst herausfinden, auf welchen Ordner R zugreift. Mit getwd() wird uns das derzeitige Verzeichnis angezeigt. “wd” steht dabei für “working directory” (etwa: Arbeitsverzeichnis). Im Working Directory “arbeitet” R bzw. liest Daten ein und speichert Skripte, den Workspace (nicht empfohlen) und geschriebene Objekte.

getwd()

Nun zeigt R an, wo es Daten speichert woher es sie einliest. Wir wollen nun erreichen, dass R auf den Ordner zugreift, in dem der Datensatz abgelegt ist. Deshalb legen wir das Verzeichnis mit setwd() fest. Schreiben Sie dazu den Pfad zu dem Verzeichnis, in dem der Datensatz abgelegt ist, in Anführungszeichen in die Funktion und führen Sie sie aus. Ein Dateipfad weist beispielsweise bei Apple die folgende Struktur auf: “/Users/christophgarwe/R_Projekt/Daten”. Bei Windows lautet der Pfad: “C:/Users/christophgarwe/R_Projekt/Daten”, wenn die Daten beim Nutzer “christophgarwe” im Ordner “R_Projekt” im Unterordner “Daten” liegen. Möchten Sie ihr Verzeichnis woanders anlegen bzw. anders benennen, müssen Sie dies anpassen. Nachfolgend müssen Sie also immer wenn von “Eigener Pfad” die Rede ist, dieses Verzeichnis dort hineinschreiben. Wenn Sie Windows nutzen und Ihren Pfad kopieren, dann müssen sie darauf achten, dass Sie die Schrägstriche anpassen. Das heißt, dass Sie \ duch / austauschen müssen.

setwd("eigener Pfad")

Prinzipiell können wir den Datensatz nun von R aus ansteuern bzw. laden. Dazu werden üblicherweise Befehle wie read.table() verwendet.

?read.table # Machen Sie sich mit den Argumenten von read.table() vertraut

Dazu müssten wir R lediglich anhand des Dateipfades mitteilen, wo der Datensatz abgelegt ist (Argument file). Allerdings liegt dieser Datensatz in dem speziellen Datenformat “.sav” vor, dem Format des Statistikprogramms SPSS. Deshalb benötigen wir eine spezielle Funktion, mit der wir den Datensatz laden können. Die Funktion, die wir zum Einladen des Datensatzes in diesem Format verwenden, lautet read.spss() und gehört zum Paket foreign. Wir installieren und laden das Paket:

install.packages("foreign")
library(foreign)

Nun können wir den Datensatz mit der Funktion read.spss() laden, die der oben erwähnten read.table() sehr ähnlich ist, jedoch speziell für “fremde” Datenformate im Rahmen des Pakets foreign entworfen wurde. Wir speichern den Datensatz in dem Objekt gles. Außerdem spezifizieren wir das Argument to.data.frame = TRUE, wodurch wir festlegen, dass der Datensatz in Form eines Dataframe vorliegen soll.

gles <- read.spss(file = "ZA6801_de_v4-0-1.sav", to.data.frame = TRUE)

Beachten Sie: In dieser Form funktioniert dieser Code nur, weil wir oben mittles setwd() das Verzeichnis so gesetzt haben, dass R am Ende des Dateinpfades die Datei “ZA6801_de_v4-0-1.sav” findet. Hätten wir das Verzeichnis nicht festgelegt, müssten wir den gesamten Dateienpfad (inklusive der Datei) unter file nennen.

2.2 Patterns of Democracy

Um den Datensatz zu “Patterns of Democracy” (A. Lijphart) zu laden, gehen wir etwas anders vor. Diesen Datensatz können Sie sich per Mausklick über den Download Button herunterladen. Die Datei heißt “Lijphart_Data_recode.csv” und wird unter Downloads gespeichert. Achten Sie darauf, dass Sie die Datei in Ihr Arbeitsverzeichnis verschieben.

Arend Lijpharts “Patterns of Democracy” ist ein Klassiker der Demokratieforschung und untersucht zwei Typen von Demokratien, die Mehrheitsdemokratie mit den klassischen Beispielen Neuseeland (vor 1996) und Barbados und die Konsensdemokratie mit den klassischen Beispielen Schweiz und Belgien. Der vorliegende Datensatz beinhaltet alle Variablen, die Lijphart verwendet, um die latenten Konzepte Mehrheits- und Konsensdemokratie zu messen. Die Beobachtungseinheiten sind dabei anders als beim GLES nicht Befragte, sondern Länder.

Anders als der GLES-Datensatz, liegt der Lijphart-Datensatz im sog. CSV-Format (“comma seperated values”) vor. D.h., in diesem Datensatz stehen alle Werte einer Zeile hintereinander, jeweils nur durch ein Komma (oder Semikolon) getrennt. Öffnen Sie den Datensatz mal mit einem .txt-Programm wie TextEdit oder einem Textverarbeitungsprogramm wie Microsoft Word, um sich einen Eindruck zu verschaffen.

3. Ein erster Blick in die Datensätze

Nachdem uns nun beide Datensätze zur Verfügung stehen, möchten wir nun einen Überlick über die darin enthaltenen Variablen bekommen. Eine einfache Möglichkeit dazu ist die Funktion str() (“structure”), die den Objekttyp des Datensatzes sowie einen Überblick über die Variablen und enthaltenen Werte zeigt.

str(gles)
## 'data.frame':    2112 obs. of  602 variables:
##  $ study       : Factor w/ 1 level "ZA6801": 1 1 1 1 1 1 1 1 1 1 ...
##  $ version     : chr  "4-0-1 (2019-02-26)" "4-0-1 (2019-02-26)" "4-0-1 (2019-02-26)" "4-0-1 (2019-02-26)" ...
##  $ doi         : chr  "doi:10.4232/1.13235" "doi:10.4232/1.13235" "doi:10.4232/1.13235" "doi:10.4232/1.13235" ...
##  $ year        : Factor w/ 1 level "2017": 1 1 1 1 1 1 1 1 1 1 ...
##  $ field       : chr  "2017-09-25 bis 2017-11-30" "2017-09-25 bis 2017-11-30" "2017-09-25 bis 2017-11-30" "2017-09-25 bis 2017-11-30" ...
##  $ glescomp    : Factor w/ 9 levels "Komponente 1: Vor- und Nachwahl-Querschnitt",..: 1 1 1 1 1 1 1 1 1 1 ...
##  $ survey      : Factor w/ 3 levels "Vorwahl-Querschnitt",..: 2 2 2 2 2 2 2 2 2 2 ...
##  $ lfdn        : num  1 2 3 4 5 6 7 8 9 10 ...
##  $ intnum      : num  63 63 63 63 63 63 63 63 63 63 ...
##  $ welle       : Factor w/ 2 levels "Basisbearbeitung",..: 1 1 1 1 1 1 1 1 1 1 ...
##  $ intdate     : num  1.37e+10 1.37e+10 1.37e+10 1.37e+10 1.37e+10 ...
##  $ beginn      : chr  "2017/11/18 1506:15" "2017/10/04 1652:52" "2017/10/05 1446:27" "2017/10/02 1058:37" ...
##  $ ende        : chr  "2017/11/18 1642:12" "2017/10/04 1820:12" "2017/10/05 1650:28" "2017/10/02 1224:38" ...
##  $ intdauer_ges: num  95.9 87.3 124 86 75.2 ...
##  $ bula        : Factor w/ 16 levels "Schleswig-Holstein",..: 1 1 1 1 1 1 1 1 1 1 ...
##  $ ostwest     : Factor w/ 2 levels "Ostdeutschland",..: 2 2 2 2 2 2 2 2 2 2 ...
##  $ ostwest2    : Factor w/ 2 levels "Ostdeutschland",..: 2 2 2 2 2 2 2 2 2 2 ...
##  $ vpoint      : num  2858 2858 2858 2858 2858 ...
##  $ wahlkreis   : Factor w/ 299 levels "1 Flensburg / Schleswig",..: 9 9 9 9 9 9 9 9 9 9 ...
##  $ w_ow        : num  1.2 1.2 1.2 1.2 1.2 ...
##  $ w_ipfges    : num  0.977 0.655 0.636 0.551 0.931 ...
##  $ w_ipfost    : num  NA NA NA NA NA NA NA NA NA NA ...
##  $ w_ipfwes    : num  0.834 0.55 0.554 0.463 0.806 ...
##  $ q1          : Factor w/ 2 levels "maennlich","weiblich": 1 1 2 1 2 1 2 1 2 2 ...
##  $ q2b         : Factor w/ 12 levels "Januar","Februar",..: 6 4 1 10 5 4 3 1 4 11 ...
##  $ q2c         : Factor w/ 79 levels "1922","1923",..: 38 42 31 17 79 37 29 54 52 76 ...
##  $ q2d         : Factor w/ 2 levels "nicht wahlberechtigt",..: 2 2 2 2 1 2 2 2 2 2 ...
##  $ q3_c1       : Factor w/ 302 levels "POLITISCHE PROZESSE (POLITICS-THEMEN)",..: 100 188 59 177 195 144 58 236 195 261 ...
##  $ q3_c2       : Factor w/ 302 levels "POLITISCHE PROZESSE (POLITICS-THEMEN)",..: NA 190 NA NA 193 141 NA NA 196 NA ...
##  $ q3_c3       : Factor w/ 302 levels "POLITISCHE PROZESSE (POLITICS-THEMEN)",..: NA 187 NA NA 107 NA NA NA NA NA ...
##  $ q3_c4       : Factor w/ 302 levels "POLITISCHE PROZESSE (POLITICS-THEMEN)",..: NA NA NA NA NA NA NA NA NA NA ...
##  $ q3_c5       : Factor w/ 302 levels "POLITISCHE PROZESSE (POLITICS-THEMEN)",..: NA NA NA NA NA NA NA NA NA NA ...
##  $ q4_c1       : Factor w/ 302 levels "POLITISCHE PROZESSE (POLITICS-THEMEN)",..: 159 200 54 72 87 261 180 71 170 195 ...
##  $ q4_c2       : Factor w/ 302 levels "POLITISCHE PROZESSE (POLITICS-THEMEN)",..: 156 NA NA NA 82 NA NA NA 171 NA ...
##  $ q4_c3       : Factor w/ 302 levels "POLITISCHE PROZESSE (POLITICS-THEMEN)",..: NA NA NA NA NA NA NA NA NA NA ...
##  $ q4_c4       : Factor w/ 302 levels "POLITISCHE PROZESSE (POLITICS-THEMEN)",..: NA NA NA NA NA NA NA NA NA NA ...
##  $ q4_c5       : Factor w/ 302 levels "POLITISCHE PROZESSE (POLITICS-THEMEN)",..: NA NA NA NA NA NA NA NA NA NA ...
##  $ q5a         : Factor w/ 55 levels "CDU/CSU","CDU",..: 2 4 54 1 1 6 4 5 42 4 ...
##  $ q5b         : Factor w/ 55 levels "CDU/CSU","CDU",..: 2 4 54 1 1 6 4 5 42 4 ...
##  $ q6a         : Factor w/ 55 levels "CDU/CSU","CDU",..: 6 4 53 1 1 54 4 5 NA 2 ...
##  $ q6b         : Factor w/ 55 levels "CDU/CSU","CDU",..: 6 4 53 1 1 54 4 5 NA 2 ...
##  $ q7          : Factor w/ 4 levels "sehr aufmerksam",..: 3 2 1 1 2 1 1 1 3 2 ...
##  $ q8a         : Factor w/ 5 levels "stimme voll und ganz zu",..: 2 3 1 1 3 1 3 3 1 1 ...
##  $ q8b         : Factor w/ 5 levels "stimme voll und ganz zu",..: 3 3 4 3 3 4 5 3 3 4 ...
##  $ q8c         : Factor w/ 5 levels "stimme voll und ganz zu",..: 2 3 1 1 4 3 2 3 4 1 ...
##  $ q8d         : Factor w/ 5 levels "stimme voll und ganz zu",..: 3 5 5 4 4 5 5 5 3 3 ...
##  $ q8e         : Factor w/ 5 levels "stimme voll und ganz zu",..: 3 4 2 2 3 5 2 5 1 3 ...
##  $ q9a         : Factor w/ 4 levels "sehr wichtig",..: 3 4 4 3 1 4 4 4 4 4 ...
##  $ q9b         : Factor w/ 4 levels "sehr wichtig",..: 3 4 4 3 3 4 4 4 4 3 ...
##  $ q9c         : Factor w/ 4 levels "sehr wichtig",..: 1 1 1 2 1 1 2 2 1 1 ...
##  $ q9d         : Factor w/ 4 levels "sehr wichtig",..: 4 4 4 2 3 3 2 4 2 2 ...
##  $ q10         : Factor w/ 4 levels "sehr verbreitet",..: 1 3 2 4 3 3 1 3 1 2 ...
##  $ q11         : Factor w/ 4 levels "sehr gute Arbeit geleistet",..: 2 2 2 2 2 3 2 3 2 2 ...
##  $ q12a        : Factor w/ 5 levels "viel hoeher als heute",..: 2 2 3 2 2 1 2 3 1 2 ...
##  $ q12b        : Factor w/ 5 levels "viel hoeher als heute",..: 1 1 3 2 3 1 1 1 1 1 ...
##  $ q12c        : Factor w/ 5 levels "viel hoeher als heute",..: 3 3 3 1 4 3 3 NA 4 2 ...
##  $ q12d        : Factor w/ 5 levels "viel hoeher als heute",..: 3 5 3 2 2 3 2 2 1 3 ...
##  $ q12e        : Factor w/ 5 levels "viel hoeher als heute",..: 1 1 3 2 1 1 2 3 1 3 ...
##  $ q12f        : Factor w/ 5 levels "viel hoeher als heute",..: 2 4 3 2 3 3 3 4 2 3 ...
##  $ q12g        : Factor w/ 5 levels "viel hoeher als heute",..: 1 2 3 1 2 2 2 2 1 2 ...
##  $ q12h        : Factor w/ 5 levels "viel hoeher als heute",..: 1 2 3 2 2 2 2 NA 4 2 ...
##  $ q13         : Factor w/ 5 levels "sehr gut","gut",..: 2 2 2 1 2 2 2 3 4 2 ...
##  $ q14         : Factor w/ 5 levels "wesentlich besser geworden",..: 4 2 4 2 4 3 2 3 5 3 ...
##  $ q15         : Factor w/ 5 levels "sehr stark","stark",..: 3 2 5 2 3 5 3 3 3 2 ...
##  $ q16         : Factor w/ 5 levels "wesentlich besser",..: 4 3 4 2 4 3 3 4 5 2 ...
##  $ q17         : Factor w/ 2 levels "ja, habe gewaehlt",..: 1 1 1 1 NA 1 1 1 1 2 ...
##  $ q18         : Factor w/ 3 levels "per Briefwahl",..: 3 2 3 3 NA 1 3 3 3 NA ...
##  $ q19aa       : Factor w/ 55 levels "CDU/CSU","CDU",..: 1 4 1 NA NA 4 4 5 NA NA ...
##  $ q19ab       : Factor w/ 55 levels "CDU/CSU","CDU",..: 1 4 1 NA NA 4 4 5 NA NA ...
##  $ q19ba       : Factor w/ 55 levels "CDU/CSU","CDU",..: 1 6 1 NA NA 6 4 5 NA NA ...
##  $ q19bb       : Factor w/ 55 levels "CDU/CSU","CDU",..: 1 6 1 NA NA 6 4 5 NA NA ...
##  $ q20         : Factor w/ 2 levels "ja, ich haette gewaehlt",..: NA NA NA NA 1 NA NA NA NA NA ...
##  $ q21aa       : Factor w/ 55 levels "CDU/CSU","CDU",..: NA NA NA NA 1 NA NA NA NA NA ...
##  $ q21ab       : Factor w/ 55 levels "CDU/CSU","CDU",..: NA NA NA NA 1 NA NA NA NA NA ...
##  $ q21ba       : Factor w/ 55 levels "CDU/CSU","CDU",..: NA NA NA NA 1 NA NA NA NA NA ...
##  $ q21bb       : Factor w/ 55 levels "CDU/CSU","CDU",..: NA NA NA NA 1 NA NA NA NA NA ...
##  $ q22         : Factor w/ 5 levels "stand schon seit langem fest",..: 2 2 3 NA NA 1 1 3 NA NA ...
##  $ q23         : Factor w/ 2 levels "ja","nein": 1 1 1 1 NA 1 1 1 1 NA ...
##  $ q24         : Factor w/ 2 levels "ja, habe gewaehlt",..: 2 1 1 1 NA 1 1 1 1 NA ...
##  $ q25aa       : Factor w/ 55 levels "CDU/CSU","CDU",..: NA 4 4 NA NA 4 4 5 4 NA ...
##  $ q25ab       : Factor w/ 55 levels "CDU/CSU","CDU",..: NA 4 4 NA NA 4 4 5 4 NA ...
##  $ q25ba       : Factor w/ 55 levels "CDU/CSU","CDU",..: NA 4 1 NA NA 6 4 5 4 NA ...
##  $ q25bb       : Factor w/ 55 levels "CDU/CSU","CDU",..: NA 4 1 NA NA 6 4 5 4 NA ...
##  $ q26         : Factor w/ 5 levels "1 Es macht keinen Unterschied, wer an der Regierung ist.",..: 3 2 3 5 4 5 5 4 3 4 ...
##  $ q27         : Factor w/ 5 levels "1 Es macht keinen Unterschied, was man waehlt.",..: 1 5 5 5 5 5 5 4 3 5 ...
##  $ q28a        : Factor w/ 11 levels "-5 halte ueberhaupt nichts von dieser Partei",..: 10 8 9 11 11 4 5 3 7 10 ...
##  $ q28b        : Factor w/ 11 levels "-5 halte ueberhaupt nichts von dieser Partei",..: 10 6 9 11 11 3 3 4 5 8 ...
##  $ q28c        : Factor w/ 11 levels "-5 halte ueberhaupt nichts von dieser Partei",..: 5 9 5 8 10 7 10 3 7 9 ...
##  $ q28d        : Factor w/ 11 levels "-5 halte ueberhaupt nichts von dieser Partei",..: 3 6 6 2 8 6 7 4 6 6 ...
##  $ q28e        : Factor w/ 11 levels "-5 halte ueberhaupt nichts von dieser Partei",..: 8 9 7 9 9 9 9 2 6 8 ...
##  $ q28f        : Factor w/ 11 levels "-5 halte ueberhaupt nichts von dieser Partei",..: 10 6 6 9 11 5 4 7 6 6 ...
##  $ q28g        : Factor w/ 11 levels "-5 halte ueberhaupt nichts von dieser Partei",..: 1 1 1 1 3 1 1 2 8 1 ...
##  $ q29a        : Factor w/ 11 levels "-5 halte ueberhaupt nichts von diesem Politiker",..: 9 8 10 10 11 4 5 3 3 9 ...
##  $ q29b        : Factor w/ 11 levels "-5 halte ueberhaupt nichts von diesem Politiker",..: 5 8 6 7 5 9 10 6 6 6 ...
##  $ q29c        : Factor w/ 11 levels "-5 halte ueberhaupt nichts von diesem Politiker",..: 5 7 7 4 8 5 8 7 5 NA ...
##  $ q29d        : Factor w/ 11 levels "-5 halte ueberhaupt nichts von diesem Politiker",..: 6 8 6 9 7 10 8 6 6 NA ...
##  $ q29e        : Factor w/ 11 levels "-5 halte ueberhaupt nichts von diesem Politiker",..: 9 NA 7 10 11 4 5 8 8 NA ...
##  $ q29f        : Factor w/ 11 levels "-5 halte ueberhaupt nichts von diesem Politiker",..: 8 1 5 4 2 1 1 1 6 NA ...
##  $ q29g        : Factor w/ 11 levels "-5 halte ueberhaupt nichts von diesem Politiker",..: 8 7 7 10 11 3 3 7 6 NA ...
##   [list output truncated]
##  - attr(*, "variable.labels")= Named chr [1:602] "Studiennummer" "GESIS Archiv Version" "Digital Object Identifier" "Erhebungsjahr" ...
##   ..- attr(*, "names")= chr [1:602] "study" "version" "doi" "year" ...
##  - attr(*, "codepage")= int 65001

gles liegt als Dataframe vor und enthält 2112 Beobachtungen (Zeilen) und 602 Variablen (Spalten). Variablen sind study, version, doi usw., wobei das Dollarzeichen, wie bei Dataframes üblich, Variablen kenzeichnet (Stizung 2). Die ersten Variablen vercoden Information zur Durchführung des Interviews, die inhaltlich interessanten Variablen folgen später. Die Bezeichnung der meisten ist recht technisch gehalten. Die Variablen liegen als numerische und character-Vektoren sowie als Faktoren vor, die in Datafraes verbunden werden können (Sitzung 2).

str(lijphart)
## 'data.frame':    36 obs. of  74 variables:
##  $ Country                  : chr  "ARG" "AUL" "AUT" "BAH" ...
##  $ exe_part4510             : chr  "-0.93" "-0.73" "0.43" "-1.50" ...
##  $ exe_part8110             : chr  "-1.01" "-0.65" "0.64" "-1.33" ...
##  $ fed_unit4510             : chr  "1.38" "1.63" "1.07" "-0.15" ...
##  $ fed_unit8110             : chr  "1.34" "1.58" "0.97" "-0.18" ...
##  $ enpp4510                 : chr  "3.15" "2.22" "2.68" "1.69" ...
##  $ enpp8110                 : chr  "3.15" "2.19" "3.23" "1.74" ...
##  $ minwin_one_part4510      : chr  "82.4" "80.7" "43.3" "100.0" ...
##  $ minwin_one_part8110      : chr  "82.4" "86.5" "47.4" "100.0" ...
##  $ exe_dom4510              : chr  "8.00" "9.10" "8.07" "9.44" ...
##  $ exe_dom8110              : chr  "8.00" "7.37" "5.90" "7.37" ...
##  $ disprop4510              : chr  "17.98" "9.44" "2.51" "16.48" ...
##  $ disprop8110              : chr  "17.98" "10.07" "2.02" "15.90" ...
##  $ inter_gr_plural4510      : chr  "2.70" "2.12" "0.38" "3.00" ...
##  $ inter_gr_plural8110      : chr  "2.70" "1.88" "0.38" "3.00" ...
##  $ federal4510              : chr  "4.5" "5.0" "4.5" "1.0" ...
##  $ federal8110              : chr  "4.5" "5.0" "4.5" "1.0" ...
##  $ bicam4510                : chr  "4.0" "4.0" "2.0" "2.0" ...
##  $ bicam8110                : chr  "4.0" "4.0" "2.0" "2.0" ...
##  $ const_rigid4510          : chr  "4.0" "4.0" "3.0" "3.0" ...
##  $ const_rigid8110          : chr  "4.0" "4.0" "3.0" "3.0" ...
##  $ judic_rev4510            : chr  "2.7" "3.0" "3.0" "2.0" ...
##  $ judic_rev8110            : chr  "2.7" "3.0" "3.0" "2.0" ...
##  $ cen_bank_indep4594       : chr  "0.39" "0.42" "0.55" "0.41" ...
##  $ cen_bank_indep8194       : chr  "0.39" "0.42" "0.53" "0.41" ...
##  $ gov_effectiv9609         : chr  "-0.08" "1.76" "1.80" "1.14" ...
##  $ regu_quality9609         : chr  "-0.42" "1.56" "1.51" "1.01" ...
##  $ rule_of_law9609          : chr  "-0.48" "1.72" "1.83" "1.16" ...
##  $ ctrl_corrupt9609         : chr  "-0.38" "1.91" "1.95" "1.28" ...
##  $ corrupt_perc10           : chr  "2.9" "8.7" "7.9" "" ...
##  $ gdp_growth8109           : chr  "" "1.880" "1.732" "" ...
##  $ gdp_growth9109           : chr  "3.210" "1.906" "1.613" "" ...
##  $ consum_price8109         : chr  "" "4.507" "2.623" "" ...
##  $ gdp_deflat8109           : chr  "" "4.607" "2.382" "" ...
##  $ consum_price9109         : chr  "15.849" "2.601" "2.145" "" ...
##  $ gdp_deflat9109           : chr  "13.745" "2.774" "1.692" "" ...
##  $ unempl8109               : chr  "" "7.331" "3.912" "" ...
##  $ unempl9109               : chr  "12.531" "7.155" "4.097" "" ...
##  $ budget_balanc0008        : chr  "" "1.2" "-1.8" "" ...
##  $ budget_balanc0307        : chr  "" "1.2" "-2.2" "-1.8" ...
##  $ heri_free0910            : chr  "51.7" "82.5" "71.9" "68.0" ...
##  $ fras_free08              : chr  "5.99" "7.90" "7.61" "7.21" ...
##  $ pol_stab9609             : chr  "-0.09" "1.01" "1.15" "0.89" ...
##  $ confl_risk9004           : chr  "10.23" "11.36" "11.79" "10.83" ...
##  $ domes_conflict_weight8109: int  NA 62 103 0 17 192 19 155 192 90 ...
##  $ domes_conflict_weight9009: int  934 34 125 0 25 169 22 169 266 84 ...
##  $ deaths_domes_terror8510  : int  5 0 0 2 2 0 3 2 1 0 ...
##  $ voice_account9609        : chr  "0.28" "1.42" "1.37" "1.09" ...
##  $ eiu_democ0610            : chr  "6.70" "9.13" "8.56" "" ...
##  $ elec_plural0610          : chr  "8.75" "10.00" "9.58" "" ...
##  $ gov_funct0610            : chr  "5.24" "8.93" "7.98" "" ...
##  $ pol_part0610             : chr  "5.56" "7.78" "7.78" "" ...
##  $ pol_cult0610             : chr  "5.84" "8.96" "8.34" "" ...
##  $ civ_lib0610              : chr  "8.14" "10.00" "9.12" "" ...
##  $ women_parl_rep90         : chr  "6.3" "6.1" "11.5" "4.1" ...
##  $ women_parl_rep10         : chr  "38.5" "24.7" "27.9" "12.2" ...
##  $ women_cab_rep95          : chr  "0.0" "5.9" "23.5" "27.3" ...
##  $ women_cab_rep08          : int  23 24 38 8 28 23 28 16 29 37 ...
##  $ gender_ineq08            : int  534 296 300 NA 448 236 663 289 501 209 ...
##  $ X10_10_ratio00           : chr  "31.8" "12.5" "6.9" "" ...
##  $ X20_20_ratio00           : chr  "16.3" "7.0" "4.4" "" ...
##  $ gini_ineq00              : chr  "51.3" "35.2" "29.1" "" ...
##  $ turnout8110              : chr  "78.43" "82.87" "78.23" "67.16" ...
##  $ non_mand_turnout8110     : chr  "" "" "78.23" "67.16" ...
##  $ satis_democ9596          : int  35 NA 63 NA NA 54 NA NA NA 83 ...
##  $ satis_democ0507          : chr  "45.1" "51.5" "" "" ...
##  $ soc_expend05             : chr  "" "18.5" "24.9" "" ...
##  $ mand_soc_expend05        : chr  "" "19.5" "25.5" "" ...
##  $ envir_perform10          : chr  "61.0" "65.7" "78.1" "" ...
##  $ incarceration10          : int  151 133 103 376 326 97 267 117 228 71 ...
##  $ death_pen10              : int  0 0 0 2 2 0 2 0 0 0 ...
##  $ foreign_aid90            : chr  "" "0.34" "0.11" "" ...
##  $ foreign_aid05            : chr  "" "0.25" "0.52" "" ...
##  $ aid_vers_def05           : int  NA 14 58 NA NA 48 NA 31 NA 45 ...

lijphart ist ebenso ein Dataframe und beinhaltet 36 Beobachtungen und 74 Variablen (Country, exe_part4510, exe_part8110 usw.). Die Variablen sind hauptsächlich character-Vectors sowie teilweise integer-Vectors (ganze Zahlen).

Mit View() können wir unsere Datensätze in ihrer eigentlichen Form, nämlich als große Tabelle, ansehen. Dabei ist zu beachten, dass man gerade bei größeren Datensätzen nur recht langsam durch den Datensatz scrollen kann.

View(gles)
View(lijphart)

Wenn wir anstatt dessen nur einen Eindruck der Variablen und der ersten enthaltenen Werte bekommen möchten, bieten sich die Funktionen head() und tail() an, die die jeweils ersten und letzten zehn Zeilen des Datensatzes zeigen. Aufgrund der Größe der Datensätze ist der Output für lijphart übersichtlicher als für gles.

# head(gles)
# tail(gles)

head(lijphart)
##   Country exe_part4510 exe_part8110 fed_unit4510 fed_unit8110 enpp4510 enpp8110
## 1     ARG        -0.93        -1.01         1.38         1.34     3.15     3.15
## 2     AUL        -0.73        -0.65         1.63         1.58     2.22     2.19
## 3     AUT         0.43         0.64         1.07         0.97     2.68     3.23
## 4     BAH        -1.50        -1.33        -0.15        -0.18     1.69     1.74
## 5     BAR        -1.28        -1.20        -0.49        -0.53     1.68     1.62
## 6     BEL         1.14         1.10         0.10         0.44     4.72     6.13
##   minwin_one_part4510 minwin_one_part8110 exe_dom4510 exe_dom8110 disprop4510
## 1                82.4                82.4        8.00        8.00       17.98
## 2                80.7                86.5        9.10        7.37        9.44
## 3                43.3                47.4        8.07        5.90        2.51
## 4               100.0               100.0        9.44        7.37       16.48
## 5               100.0               100.0        8.87        7.37       17.27
## 6                37.3                36.3        2.57        4.21        3.35
##   disprop8110 inter_gr_plural4510 inter_gr_plural8110 federal4510 federal8110
## 1       17.98                2.70                2.70         4.5         4.5
## 2       10.07                2.12                1.88         5.0         5.0
## 3        2.02                0.38                0.38         4.5         4.5
## 4       15.90                3.00                3.00         1.0         1.0
## 5       18.72                2.20                2.00         1.0         1.0
## 6        3.75                1.15                1.33         3.5         4.2
##   bicam4510 bicam8110 const_rigid4510 const_rigid8110 judic_rev4510
## 1       4.0       4.0             4.0             4.0           2.7
## 2       4.0       4.0             4.0             4.0           3.0
## 3       2.0       2.0             3.0             3.0           3.0
## 4       2.0       2.0             3.0             3.0           2.0
## 5       2.0       2.0             2.0             2.0           2.0
## 6       2.8       2.5             3.0             3.0           1.8
##   judic_rev8110 cen_bank_indep4594 cen_bank_indep8194 gov_effectiv9609
## 1           2.7               0.39               0.39            -0.08
## 2           3.0               0.42               0.42             1.76
## 3           3.0               0.55               0.53             1.80
## 4           2.0               0.41               0.41             1.14
## 5           2.0               0.38               0.38             1.36
## 6           2.7               0.27               0.30             1.68
##   regu_quality9609 rule_of_law9609 ctrl_corrupt9609 corrupt_perc10
## 1            -0.42           -0.48            -0.38            2.9
## 2             1.56            1.72             1.91            8.7
## 3             1.51            1.83             1.95            7.9
## 4             1.01            1.16             1.28               
## 5             0.98            1.12             1.32            7.8
## 6             1.24            1.31             1.37            7.1
##   gdp_growth8109 gdp_growth9109 consum_price8109 gdp_deflat8109
## 1                         3.210                                
## 2          1.880          1.906            4.507          4.607
## 3          1.732          1.613            2.623          2.382
## 4                                                              
## 5                                                              
## 6          1.552          1.371            2.930          2.756
##   consum_price9109 gdp_deflat9109 unempl8109 unempl9109 budget_balanc0008
## 1           15.849         13.745                12.531                  
## 2            2.601          2.774      7.331      7.155               1.2
## 3            2.145          1.692      3.912      4.097              -1.8
## 4                                                                        
## 5                                                                        
## 6            2.062          1.961      8.744      8.054              -0.5
##   budget_balanc0307 heri_free0910 fras_free08 pol_stab9609 confl_risk9004
## 1                            51.7        5.99        -0.09          10.23
## 2               1.2          82.5        7.90         1.01          11.36
## 3              -2.2          71.9        7.61         1.15          11.79
## 4              -1.8          68.0        7.21         0.89          10.83
## 5                            68.5        6.35         1.05               
## 6              -0.7          70.2        7.22         0.92          11.59
##   domes_conflict_weight8109 domes_conflict_weight9009 deaths_domes_terror8510
## 1                        NA                       934                       5
## 2                        62                        34                       0
## 3                       103                       125                       0
## 4                         0                         0                       2
## 5                        17                        25                       2
## 6                       192                       169                       0
##   voice_account9609 eiu_democ0610 elec_plural0610 gov_funct0610 pol_part0610
## 1              0.28          6.70            8.75          5.24         5.56
## 2              1.42          9.13           10.00          8.93         7.78
## 3              1.37          8.56            9.58          7.98         7.78
## 4              1.09                                                         
## 5              1.21                                                         
## 6              1.39          8.12            9.58          8.21         6.11
##   pol_cult0610 civ_lib0610 women_parl_rep90 women_parl_rep10 women_cab_rep95
## 1         5.84        8.14              6.3             38.5             0.0
## 2         8.96       10.00              6.1             24.7             5.9
## 3         8.34        9.12             11.5             27.9            23.5
## 4                                       4.1             12.2            27.3
## 5                                       3.7             10.0            27.3
## 6         7.29        9.41              8.5             39.3            11.8
##   women_cab_rep08 gender_ineq08 X10_10_ratio00 X20_20_ratio00 gini_ineq00
## 1              23           534           31.8           16.3        51.3
## 2              24           296           12.5            7.0        35.2
## 3              38           300            6.9            4.4        29.1
## 4               8            NA                                          
## 5              28           448                                          
## 6              23           236            8.2            4.9        33.0
##   turnout8110 non_mand_turnout8110 satis_democ9596 satis_democ0507 soc_expend05
## 1       78.43                                   35            45.1             
## 2       82.87                                   NA            51.5         18.5
## 3       78.23                78.23              63                         24.9
## 4       67.16                67.16              NA                             
## 5       71.35                71.35              NA                             
## 6       86.32                                   54                         26.2
##   mand_soc_expend05 envir_perform10 incarceration10 death_pen10 foreign_aid90
## 1                              61.0             151           0              
## 2              19.5            65.7             133           0          0.34
## 3              25.5            78.1             103           0          0.11
## 4                                               376           2              
## 5                                               326           2              
## 6              26.2            58.1              97           0          0.46
##   foreign_aid05 aid_vers_def05
## 1                           NA
## 2          0.25             14
## 3          0.52             58
## 4                           NA
## 5                           NA
## 6          0.53             48
tail(lijphart)
##    Country exe_part4510 exe_part8110 fed_unit4510 fed_unit8110 enpp4510
## 31     SWE         0.79         0.87        -1.03        -1.09     3.47
## 32     SWI         1.72         1.67         1.46         1.59     5.20
## 33     TRI        -1.01        -0.79        -0.24        -0.34     1.87
## 34      UK        -1.09        -1.48        -1.06        -1.12     2.16
## 35     URU         0.39         0.31        -0.79        -0.84     4.40
## 36      US        -0.67        -0.63         2.25         2.18     2.39
##    enpp8110 minwin_one_part4510 minwin_one_part8110 exe_dom4510 exe_dom8110
## 31     3.82                48.1                42.6        5.61        4.92
## 32     5.50                 4.0                 1.7        1.00        1.00
## 33     1.88                94.3                90.7        6.95        4.21
## 34     2.27                97.3                99.8        8.12        9.83
## 35     4.40                80.3                80.3        4.00        4.00
## 36     2.37                80.4                78.9        4.00        4.00
##    disprop4510 disprop8110 inter_gr_plural4510 inter_gr_plural8110 federal4510
## 31        2.04        1.95                0.35                0.42         2.0
## 32        2.55        3.08                0.88                0.88         5.0
## 33       11.33       11.67                3.00                3.00         1.3
## 34       11.70       16.00                3.02                3.08         1.2
## 35        6.05        6.05                1.70                1.70         1.0
## 36       14.28       13.35                3.02                2.88         5.0
##    federal8110 bicam4510 bicam8110 const_rigid4510 const_rigid8110
## 31         2.0       1.7       1.0             1.5             2.0
## 32         5.0       4.0       4.0             4.0             4.0
## 33         1.5       2.0       2.0             3.0             3.0
## 34         1.4       2.5       2.5             1.0             1.0
## 35         1.0       3.0       3.0             1.0             1.0
## 36         5.0       4.0       4.0             4.0             4.0
##    judic_rev4510 judic_rev8110 cen_bank_indep4594 cen_bank_indep8194
## 31           1.0           1.0               0.29               0.29
## 32           1.0           1.0               0.61               0.68
## 33           2.0           2.0               0.35               0.30
## 34           1.0           1.0               0.31               0.28
## 35           2.5           2.5               0.19               0.19
## 36           4.0           4.0               0.56               0.56
##    gov_effectiv9609 regu_quality9609 rule_of_law9609 ctrl_corrupt9609
## 31             1.96             1.50            1.81             2.17
## 32             1.97             1.56            1.84             2.06
## 33             0.30             0.68            0.09             0.11
## 34             1.76             1.69            1.65             1.90
## 35             0.51             0.46            0.57             0.94
## 36             1.64             1.51            1.54             1.53
##    corrupt_perc10 gdp_growth8109 gdp_growth9109 consum_price8109 gdp_deflat8109
## 31            9.2          1.640          1.493            3.915          4.061
## 32            8.7            910            545            2.125          2.059
## 33            3.6          1.615          4.209            7.752          5.752
## 34            7.6          1.960          1.642            4.119          4.032
## 35            6.9                         2.732                                
## 36            7.1          1.731          1.439            3.370          2.939
##    consum_price9109 gdp_deflat9109 unempl8109 unempl9109 budget_balanc0008
## 31            1.968          2.182      5.618      7.145                  
## 32            1.450          1.274                 3.465               0.4
## 33            6.001          5.523     13.934     12.308                  
## 34            2.821          2.743                 6.661              -2.1
## 35           24.313         23.020                11.198              -2.5
## 36            2.649          2.249      6.159      5.653                  
##    budget_balanc0307 heri_free0910 fras_free08 pol_stab9609 confl_risk9004
## 31                            71.9        7.28         1.25          11.38
## 32              -0.1          81.9        8.08         1.25          12.00
## 33               2.5          66.5        7.10         0.04           8.82
## 34              -3.0          74.5        7.81         0.62          10.00
## 35              -2.1          70.0        6.93         0.77           8.80
## 36              -2.8          77.8        7.96         0.50          10.99
##    domes_conflict_weight8109 domes_conflict_weight9009 deaths_domes_terror8510
## 31                        58                        50                       0
## 32                        34                        25                       0
## 33                       136                       184                      23
## 34                      1998                      1303                      55
## 35                        NA                       325                       0
## 36                       269                       288                      28
##    voice_account9609 eiu_democ0610 elec_plural0610 gov_funct0610 pol_part0610
## 31              1.55          9.75            9.86          9.88         9.63
## 32              1.52          9.09            9.58          9.29         7.78
## 33              0.61          7.18            9.44          6.91         6.11
## 34              1.33          8.13            9.58          8.33         5.37
## 35              0.96          8.05           10.00          8.33         4.81
## 36              1.25          8.21            8.89          7.86         7.22
##    pol_cult0610 civ_lib0610 women_parl_rep90 women_parl_rep10 women_cab_rep95
## 31         9.38       10.00             38.4             45.0            47.6
## 32         9.17        9.61             14.0             29.0            14.3
## 33         5.42        8.04             16.7             28.6            15.8
## 34         8.34        9.02              6.3             22.0             8.7
## 35         7.29        9.81              6.1             15.2             5.9
## 36         8.54        8.53              6.6             16.9            20.0
##    women_cab_rep08 gender_ineq08 X10_10_ratio00 X20_20_ratio00 gini_ineq00
## 31              48           212            6.2            4.0        25.0
## 32              43           228            9.0            5.5        33.7
## 33              36           473           12.9            7.6        38.9
## 34              23           355           13.8            7.2        36.0
## 35              29           508           17.9           10.2        44.9
## 36              44           400           15.9            8.4        40.8
##    turnout8110 non_mand_turnout8110 satis_democ9596 satis_democ0507
## 31       82.38                82.38              55            61.5
## 32       38.29                38.29              NA            61.3
## 33       71.00                71.00              NA            32.1
## 34       67.92                67.92              46            33.3
## 35       94.51                                   52            60.9
## 36       51.30                51.30              NA            35.5
##    soc_expend05 mand_soc_expend05 envir_perform10 incarceration10 death_pen10
## 31         27.3              27.5            86.0              78           0
## 32                                           89.1              79           0
## 33                                           54.2             276           2
## 34         22.9              23.7            74.2             152           0
## 35                                           59.1             261           0
## 36         18.4              18.8            63.5             743           2
##    foreign_aid90 foreign_aid05 aid_vers_def05
## 31          0.91          0.94             63
## 32          0.32          0.44             44
## 33                                         NA
## 34          0.27          0.47             17
## 35                                         NA
## 36          0.21          0.22              5

4. Zusammenfassung

gles ist ein Datensatz aus der Wahlforschung zur Bundestagswahl 2017. lijphart ist der Datensatz zu Arend Lijpharts “Patterns of Democracy”. Um Datensätze zu laden, müssen Verzeichnisse mit setwd() gesetzt und Daten je nach Format mit einer Funktion wie read.table() geladen werden. Bei Fremdformaten kommen Funktionen des Pakets foreign wie read.spss() zur Anwendung. Mit str(), View() sowie head() und tail() bekommen wir einen ersten Überblick über Datensätze.

5. Datensätze Quellen

GLES (2019). Nachwahl-Querschnitt (GLES 2017). GESIS Datenarchiv, Köln. ZA6801 Datenfile Version 4.0.1, https://doi.org/10.4232/1.13235.

Lijphart, Arend (2012): Patterns of Democracy. Government Forms and Performance in Thirty-Six Countries. 2nd Edition. New Haven/London: Yale University Press.