2024-11-12
R statt SPSS in der Datenaufbereitung
Liste bestehend aus
dat)labels)Liste bestehend aus
dat)
labels)
varName - VariablennamevarLabel - Variablenlabelformat - SPSS-Formatvalue - numerischer WertvalLabel - Wertelabelmissings - Missingtags (miss oder valid)Daten

Meta-Daten

Import und Export
Anzeigen von Variablennamen im Datensatz via namesGADS()
Extraktion von Meta-Daten via extractMeta()
varName varLabel format display_width labeled value
2 idstud Student-ID F8.0 NA no NA
5 schtype School track F8.0 NA yes 1
6 schtype School track F8.0 NA yes 2
7 schtype School track F8.0 NA yes 3
valLabel missings
2 <NA> <NA>
5 Gymnasium (academic track) valid
6 Realschule valid
7 schools with several courses of education valid
Änderung von Meta-Daten
# Variablenname
pisa2 <- changeVarNames(pisa, oldNames = "idstud",
newNames = "IDSTUD")
# Variablenlabel
pisa2 <- changeVarLabels(pisa2, varName = "schtype",
varLabel = "Schulart")
# Wertelabel
pisa2 <- changeValLabels(pisa2, varName = "schtype",
value = 1, valLabel = "Gymnasium")
# Missingtag
pisa2 <- changeMissings(pisa2, varName = "schtype",
value = -99, missings = "miss") varName varLabel format display_width labeled value
1 IDSTUD Student-ID F8.0 NA no NA
4 schtype Schulart F8.0 NA yes -99
5 schtype Schulart F8.0 NA yes 1
6 schtype Schulart F8.0 NA yes 2
7 schtype Schulart F8.0 NA yes 3
valLabel missings
1 <NA> <NA>
4 <NA> miss
5 Gymnasium valid
6 Realschule valid
7 schools with several courses of education valid
Änderung von Daten
# Variable duplizieren
pisa3 <- cloneVariable(pisa2, varName = "schtype",
new_varName = "schtype_dich")
# Rekodierung
pisa3 <- recodeGADS(pisa3, varName = "schtype_dich",
oldValues = c(1, 2, 3),
newValues = c(1, 2, 2),
existingMeta = "drop")
# Anpassung Wertelabel
pisa3 <- changeValLabels(pisa3, varName = "schtype_dich",
value = 2, valLabel = "Nicht-Gymnasium")example_data.sav aus dem eatFDZ Paket (© Annegret Rucker)."books"."school_dich") mit 1 = "nicht-Gymnasium" und 2 = "Gymnasium".Import-Funktionen
import_spss() - Import von .savimport_stata() - Import von .dtaimport_DF() - Import von data.framesimport_RDS() - Import von .RDS Dateienimport_raw() - Direkt-Import von Rohdaten & MetadatenExport-Funktionen
write_spss() - Export von .savwrite_spss2() - Alternativer Export von .savwrite_stata() - Export von .dtaextractData2() - Extraktion von Datensätzen innerhalb RMeta-Daten bearbeiten
getChangeMeta() - Extrahiert Änderungen in den Meta-DatenapplyChangeMeta() - Wendet Änderungen in den Meta-Daten anchangeVarLabels() - Änderungen VariablenlabelchangeValLabels() - Änderungen WertelabelchangeMissings() - Änderungen Missing-TagschangeVarNames()- Änderungen VariablennamenchangeSPSSformat() - Änderungen SPSS-FormatreuseMeta() - Wiederverwendung von Meta-DatenupdateMeta() - Aktualisiert Meta-Daten im DatensatzGrundlegende Daten-Struktur bearbeiten
extractVars() - Extraktion ausgewählter VariablenremoveVars() - Entfernen bestimmter VariablencloneVar() - Kopiert eine VariablerelocateVariable() - Verschiebt eine Variable an eine neue PositionorderLike() - Anordnung aller VariablenSemi-automatisierte Funktionen
calculateScale() - Erstellen einer SkalacollapseMC_Text() - Rekodierung eines forced Choice Items mit FreitextmöglichkeitcollapseMultiMC_Text() - Rekodierung eines multiple Choice Items mit FreitextmöglichkeitcomposeVar() - Kombination unterschiedlicher InformationsquellenconvertCase() - Änderung Groß-/Kleinschreibungdummies2char()fac2dummies()multiChar2fac()"ID_name" und "info" aus Anonymisierungsgründen vollständig aus dem Datensatz."grade_<fach>").Vergleichs-Funktionen
equalGADS() - Abgleich zweier GADSdat ObjekteinspectDifferences() - Datenunterschiede zweier VariableninspectMetaDifferences() - Meta-Datenunterschiede zweier VariablencompareGADS()Check-Funktionen
checkVarNames() - Konventionen VariablennamenfixEncoding() - Umlaute & SonderzeichencheckMissings() - Abgleich Wertelabels & MissingtagscheckMissingsByValues() - Abgleich gelabelte numerische Werte & MissingtagscheckEmptyValLabels() - Abgleich Wertelabels & DatencheckMissingValLabels() - Abgleich Daten & WertelabelsKonventionen Variablennamen
_ vs .Konventionen Variablennamen
_ vs .Test-Daten
Test-Daten
varName varLabel value valLabel missings
1 ID Identifier NA <NA> <NA>
2 Ä_Größe <NA> 1 groß valid
3 Ä_Größe <NA> 2 klein valid
4 Ä_Qualität <NA> -99 Missing Unbekannt miss
5 Ä_Qualität <NA> -97 Missing by Design valid
6 Ä_Qualität <NA> -98 <NA> miss
7 Ort <NA> NA <NA> <NA>
Umlaute & Sonderzeichen umwandeln
ß zu ss, ä zu ae usw.Umlaute & Sonderzeichen umwandeln
Umlaute & Sonderzeichen umwandeln
# Display specific columns of the labels data
aepfel$labels[, c("varName", "varLabel", "value", "valLabel", "missings")] varName varLabel value valLabel missings
1 ID Identifier NA <NA> <NA>
2 Ae_Groesse <NA> 1 gross valid
3 Ae_Groesse <NA> 2 klein valid
4 Ae_Qualitaet <NA> -99 Missing Unbekannt miss
5 Ae_Qualitaet <NA> -97 Missing by Design valid
6 Ae_Qualitaet <NA> -98 <NA> miss
7 Ort <NA> NA <NA> <NA>
Abgleich Wertelabels und Missingtags
→ Reporting und/oder Anpassung
Abgleich gelabelte numerische Werte und Missingtags
→ Reporting und/oder Anpassung
Abgleich Daten und Wertelabels
Abgleich Daten und Wertelabels
checkMissings() und checkMissingsByValues().checkEmptyValLabels()). Sollten diese Wertelabel aus den Daten entfernt werden?checkMissingValLabels()).Danke für Eure
Aufmerksamkeit!

Datenaufbereitung