Hvordan skal man behandle med manglende data Værdier i R

Regionsudvalget () funktionen i R kan håndtere manglende dataværdier på flere måder. Til det, du indstille brugen argument til en af ​​de mulige tekst værdier. Værdien for brug argument er især vigtigt, hvis du beregne korrelationer af variablerne i en data frame. Ved at sætte dette argument til forskellige værdier, kan du

  • Brug alle observationer ved at sætte brug = "alt". Det betyder, at hvis thereâ € s nogen NA værdi i en af de variabler, den resulterende korrelation er NA så godt. Dette er standard.
  • Udeluk alle observationer, der har NA i mindst en variabel. For dette, du indstille bruge = 'complete.obs «. Bemærk, at det kan efterlade dig med kun et par bemærkninger om manglende værdier spredes gennem hele datasæt.
  • Udeluk observationer med NA-værdier for hvert par variabler, du undersøger. Til det, du indstille brugen argument = 'parvis'. Dette sikrer, at du kan beregne korrelation for hvert par variabler uden at miste information på grund af manglende værdier i de andre variable.

Faktisk kan du beregne forskellige mål for korrelation. Som standard R beregner standard Pearson korrelationskoefficient. For data, der normalt ikke distribueres, kan du bruge cor () til at beregne Spearman rang korrelation eller Kendallâ € s tau. Til dette, er du nødt til at indstille metoden argument til den relevante værdi.


© 2020 Zajacperrone.com | Contact us: webmaster# zajacperrone.com