2024-11-12
R statt SPSS in der Datenaufbereitung
Liste bestehend aus
dat
)labels
)Liste bestehend aus
dat
)
labels
)
varName
- VariablennamevarLabel
- Variablenlabelformat
- SPSS-Formatvalue
- numerischer WertvalLabel
- Wertelabelmissings
- Missingtags (miss
oder valid
)Daten
Meta-Daten
Import und Export
Anzeigen von Variablennamen im Datensatz via namesGADS()
Extraktion von Meta-Daten via extractMeta()
varName varLabel format display_width labeled value
2 idstud Student-ID F8.0 NA no NA
5 schtype School track F8.0 NA yes 1
6 schtype School track F8.0 NA yes 2
7 schtype School track F8.0 NA yes 3
valLabel missings
2 <NA> <NA>
5 Gymnasium (academic track) valid
6 Realschule valid
7 schools with several courses of education valid
Änderung von Meta-Daten
# Variablenname
pisa2 <- changeVarNames(pisa, oldNames = "idstud",
newNames = "IDSTUD")
# Variablenlabel
pisa2 <- changeVarLabels(pisa2, varName = "schtype",
varLabel = "Schulart")
# Wertelabel
pisa2 <- changeValLabels(pisa2, varName = "schtype",
value = 1, valLabel = "Gymnasium")
# Missingtag
pisa2 <- changeMissings(pisa2, varName = "schtype",
value = -99, missings = "miss")
varName varLabel format display_width labeled value
1 IDSTUD Student-ID F8.0 NA no NA
4 schtype Schulart F8.0 NA yes -99
5 schtype Schulart F8.0 NA yes 1
6 schtype Schulart F8.0 NA yes 2
7 schtype Schulart F8.0 NA yes 3
valLabel missings
1 <NA> <NA>
4 <NA> miss
5 Gymnasium valid
6 Realschule valid
7 schools with several courses of education valid
Änderung von Daten
# Variable duplizieren
pisa3 <- cloneVariable(pisa2, varName = "schtype",
new_varName = "schtype_dich")
# Rekodierung
pisa3 <- recodeGADS(pisa3, varName = "schtype_dich",
oldValues = c(1, 2, 3),
newValues = c(1, 2, 2),
existingMeta = "drop")
# Anpassung Wertelabel
pisa3 <- changeValLabels(pisa3, varName = "schtype_dich",
value = 2, valLabel = "Nicht-Gymnasium")
example_data.sav
aus dem eatFDZ Paket (© Annegret Rucker)."books"
."school_dich"
) mit 1 = "nicht-Gymnasium"
und 2 = "Gymnasium"
.Import-Funktionen
import_spss()
- Import von .sav
import_stata()
- Import von .dta
import_DF()
- Import von data.frames
import_RDS()
- Import von .RDS
Dateienimport_raw()
- Direkt-Import von Rohdaten & MetadatenExport-Funktionen
write_spss()
- Export von .sav
write_spss2()
- Alternativer Export von .sav
write_stata()
- Export von .dta
extractData2()
- Extraktion von Datensätzen innerhalb R
Meta-Daten bearbeiten
getChangeMeta()
- Extrahiert Änderungen in den Meta-DatenapplyChangeMeta()
- Wendet Änderungen in den Meta-Daten anchangeVarLabels()
- Änderungen VariablenlabelchangeValLabels()
- Änderungen WertelabelchangeMissings()
- Änderungen Missing-TagschangeVarNames()
- Änderungen VariablennamenchangeSPSSformat()
- Änderungen SPSS-FormatreuseMeta()
- Wiederverwendung von Meta-DatenupdateMeta()
- Aktualisiert Meta-Daten im DatensatzGrundlegende Daten-Struktur bearbeiten
extractVars()
- Extraktion ausgewählter VariablenremoveVars()
- Entfernen bestimmter VariablencloneVar()
- Kopiert eine VariablerelocateVariable()
- Verschiebt eine Variable an eine neue PositionorderLike()
- Anordnung aller VariablenSemi-automatisierte Funktionen
calculateScale()
- Erstellen einer SkalacollapseMC_Text()
- Rekodierung eines forced Choice Items mit FreitextmöglichkeitcollapseMultiMC_Text()
- Rekodierung eines multiple Choice Items mit FreitextmöglichkeitcomposeVar()
- Kombination unterschiedlicher InformationsquellenconvertCase()
- Änderung Groß-/Kleinschreibungdummies2char()
fac2dummies()
multiChar2fac()
"ID_name"
und "info"
aus Anonymisierungsgründen vollständig aus dem Datensatz."grade_<fach>"
).Vergleichs-Funktionen
equalGADS()
- Abgleich zweier GADSdat
ObjekteinspectDifferences()
- Datenunterschiede zweier VariableninspectMetaDifferences()
- Meta-Datenunterschiede zweier VariablencompareGADS()
Check-Funktionen
checkVarNames()
- Konventionen VariablennamenfixEncoding()
- Umlaute & SonderzeichencheckMissings()
- Abgleich Wertelabels & MissingtagscheckMissingsByValues()
- Abgleich gelabelte numerische Werte & MissingtagscheckEmptyValLabels()
- Abgleich Wertelabels & DatencheckMissingValLabels()
- Abgleich Daten & WertelabelsKonventionen Variablennamen
_
vs .
Konventionen Variablennamen
_
vs .
Test-Daten
Test-Daten
varName varLabel value valLabel missings
1 ID Identifier NA <NA> <NA>
2 Ä_Größe <NA> 1 groß valid
3 Ä_Größe <NA> 2 klein valid
4 Ä_Qualität <NA> -99 Missing Unbekannt miss
5 Ä_Qualität <NA> -97 Missing by Design valid
6 Ä_Qualität <NA> -98 <NA> miss
7 Ort <NA> NA <NA> <NA>
Umlaute & Sonderzeichen umwandeln
ß
zu ss
, ä
zu ae
usw.Umlaute & Sonderzeichen umwandeln
Umlaute & Sonderzeichen umwandeln
# Display specific columns of the labels data
aepfel$labels[, c("varName", "varLabel", "value", "valLabel", "missings")]
varName varLabel value valLabel missings
1 ID Identifier NA <NA> <NA>
2 Ae_Groesse <NA> 1 gross valid
3 Ae_Groesse <NA> 2 klein valid
4 Ae_Qualitaet <NA> -99 Missing Unbekannt miss
5 Ae_Qualitaet <NA> -97 Missing by Design valid
6 Ae_Qualitaet <NA> -98 <NA> miss
7 Ort <NA> NA <NA> <NA>
Abgleich Wertelabels und Missingtags
→ Reporting und/oder Anpassung
Abgleich gelabelte numerische Werte und Missingtags
→ Reporting und/oder Anpassung
Abgleich Daten und Wertelabels
Abgleich Daten und Wertelabels
checkMissings()
und checkMissingsByValues()
.checkEmptyValLabels()
). Sollten diese Wertelabel aus den Daten entfernt werden?checkMissingValLabels()
).Danke für Eure
Aufmerksamkeit!
Datenaufbereitung