2024-11-12
R statt SPSS in der Datenaufbereitung
Liste bestehend aus
dat)labels)Liste bestehend aus
dat)
labels)
varName - VariablennamevarLabel - Variablenlabelformat - SPSS-Formatvalue - numerischer WertvalLabel - Wertelabelmissings - Missingtags (miss oder valid)Daten

Meta-Daten

Import und Export
Anzeigen von Variablennamen im Datensatz via namesGADS()
Extraktion von Meta-Daten via extractMeta()
  varName     varLabel format display_width labeled value
2  idstud   Student-ID   F8.0            NA      no    NA
5 schtype School track   F8.0            NA     yes     1
6 schtype School track   F8.0            NA     yes     2
7 schtype School track   F8.0            NA     yes     3
                                   valLabel missings
2                                      <NA>     <NA>
5                Gymnasium (academic track)    valid
6                                Realschule    valid
7 schools with several courses of education    validÄnderung von Meta-Daten
# Variablenname
pisa2 <- changeVarNames(pisa, oldNames = "idstud",
                         newNames = "IDSTUD")
# Variablenlabel
pisa2 <- changeVarLabels(pisa2, varName = "schtype",
                         varLabel = "Schulart")
# Wertelabel
pisa2 <- changeValLabels(pisa2, varName = "schtype",
                         value = 1, valLabel = "Gymnasium")
# Missingtag
pisa2 <- changeMissings(pisa2, varName = "schtype",
                         value = -99, missings = "miss")  varName   varLabel format display_width labeled value
1  IDSTUD Student-ID   F8.0            NA      no    NA
4 schtype   Schulart   F8.0            NA     yes   -99
5 schtype   Schulart   F8.0            NA     yes     1
6 schtype   Schulart   F8.0            NA     yes     2
7 schtype   Schulart   F8.0            NA     yes     3
                                   valLabel missings
1                                      <NA>     <NA>
4                                      <NA>     miss
5                                 Gymnasium    valid
6                                Realschule    valid
7 schools with several courses of education    validÄnderung von Daten
# Variable duplizieren
pisa3 <- cloneVariable(pisa2, varName = "schtype",
                       new_varName = "schtype_dich")
# Rekodierung
pisa3 <- recodeGADS(pisa3, varName = "schtype_dich",
                    oldValues = c(1, 2, 3),
                    newValues = c(1, 2, 2),
                    existingMeta = "drop")
# Anpassung Wertelabel
pisa3 <- changeValLabels(pisa3, varName = "schtype_dich",
                     value = 2, valLabel = "Nicht-Gymnasium")example_data.sav aus dem eatFDZ Paket (© Annegret Rucker)."books"."school_dich") mit 1 = "nicht-Gymnasium" und 2 = "Gymnasium".Import-Funktionen
import_spss() - Import von .savimport_stata() - Import von .dtaimport_DF() - Import von data.framesimport_RDS() - Import von .RDS Dateienimport_raw() - Direkt-Import von Rohdaten & MetadatenExport-Funktionen
write_spss() - Export von .savwrite_spss2() - Alternativer Export von .savwrite_stata() - Export von .dtaextractData2() - Extraktion von Datensätzen innerhalb RMeta-Daten bearbeiten
getChangeMeta() - Extrahiert Änderungen in den Meta-DatenapplyChangeMeta() - Wendet Änderungen in den Meta-Daten anchangeVarLabels() - Änderungen VariablenlabelchangeValLabels() - Änderungen WertelabelchangeMissings() - Änderungen Missing-TagschangeVarNames()- Änderungen VariablennamenchangeSPSSformat() - Änderungen SPSS-FormatreuseMeta() - Wiederverwendung von Meta-DatenupdateMeta() - Aktualisiert Meta-Daten im DatensatzGrundlegende Daten-Struktur bearbeiten
extractVars() - Extraktion ausgewählter VariablenremoveVars() - Entfernen bestimmter VariablencloneVar() - Kopiert eine VariablerelocateVariable() - Verschiebt eine Variable an eine neue PositionorderLike() - Anordnung aller VariablenSemi-automatisierte Funktionen
calculateScale() - Erstellen einer SkalacollapseMC_Text() - Rekodierung eines forced Choice Items mit FreitextmöglichkeitcollapseMultiMC_Text() - Rekodierung eines multiple Choice Items mit FreitextmöglichkeitcomposeVar() - Kombination unterschiedlicher InformationsquellenconvertCase() - Änderung Groß-/Kleinschreibungdummies2char()fac2dummies()multiChar2fac()"ID_name" und "info" aus Anonymisierungsgründen vollständig aus dem Datensatz."grade_<fach>").Vergleichs-Funktionen
equalGADS() - Abgleich zweier GADSdat ObjekteinspectDifferences() - Datenunterschiede zweier VariableninspectMetaDifferences() - Meta-Datenunterschiede zweier VariablencompareGADS()Check-Funktionen
checkVarNames() - Konventionen VariablennamenfixEncoding() - Umlaute & SonderzeichencheckMissings() - Abgleich Wertelabels & MissingtagscheckMissingsByValues() - Abgleich gelabelte numerische Werte & MissingtagscheckEmptyValLabels() - Abgleich Wertelabels & DatencheckMissingValLabels() - Abgleich Daten & WertelabelsKonventionen Variablennamen
_ vs .Konventionen Variablennamen
_ vs .Test-Daten
Test-Daten
     varName   varLabel value          valLabel missings
1         ID Identifier    NA              <NA>     <NA>
2    Ä_Größe       <NA>     1              groß    valid
3    Ä_Größe       <NA>     2             klein    valid
4 Ä_Qualität       <NA>   -99 Missing Unbekannt     miss
5 Ä_Qualität       <NA>   -97 Missing by Design    valid
6 Ä_Qualität       <NA>   -98              <NA>     miss
7        Ort       <NA>    NA              <NA>     <NA>Umlaute & Sonderzeichen umwandeln
ß zu ss, ä zu ae usw.Umlaute & Sonderzeichen umwandeln
Umlaute & Sonderzeichen umwandeln
# Display specific columns of the labels data
aepfel$labels[, c("varName", "varLabel", "value", "valLabel", "missings")]       varName   varLabel value          valLabel missings
1           ID Identifier    NA              <NA>     <NA>
2   Ae_Groesse       <NA>     1             gross    valid
3   Ae_Groesse       <NA>     2             klein    valid
4 Ae_Qualitaet       <NA>   -99 Missing Unbekannt     miss
5 Ae_Qualitaet       <NA>   -97 Missing by Design    valid
6 Ae_Qualitaet       <NA>   -98              <NA>     miss
7          Ort       <NA>    NA              <NA>     <NA>Abgleich Wertelabels und Missingtags
→ Reporting und/oder Anpassung
Abgleich gelabelte numerische Werte und Missingtags
→ Reporting und/oder Anpassung
Abgleich Daten und Wertelabels
Abgleich Daten und Wertelabels
checkMissings() und checkMissingsByValues().checkEmptyValLabels()). Sollten diese Wertelabel aus den Daten entfernt werden?checkMissingValLabels()).Danke für Eure
Aufmerksamkeit!

Datenaufbereitung