Sådan bruges Fraktilværdier Plots at kontrollere oplysninger Normalitet i R

Histogrammer lader meget for fortolkningen af ​​seeren. En bedre grafisk måde i R for at se, om dine data er normalfordelt, er at se på en såkaldt fraktil-fraktil (QQ) plot.

Med denne teknik, du plotte fraktiler mod hinanden. Hvis du sammenligner to prøver, for eksempel, skal du blot sammenligne fraktiler for begge prøver. Eller for at sige det lidt anderledes, R gør følgende for at konstruere et QQ plot:

  • Det sorterer data fra begge prøver.
  • Det plotter disse sorterede værdier mod hinanden.

Hvis begge prøver donâ € t indeholder det samme antal værdier, R beregner ekstra værdier ved interpolation for de mindste prøve at oprette to eksemplarer af samme størrelse.

Hvordan til at sammenligne data to prøver

Selvfølgelig du donâ € t nødt til at gøre det hele selv, kan du blot bruge qqplot () funktionen til at. Så for at kontrollere, om de temperaturer under aktivitet og under resten er fordelt ligeligt, skal du blot gøre følgende:

> Qqplot (beaver2 $ temp [beaver2 $ Activ == 1],
+ Beaver2 $ temp [beaver2 $ Activ == 0])

Dette skaber et plot, hvor de bestilte værdier afbildes mod hinanden.

Sådan bruges Fraktilværdier Plots at kontrollere oplysninger Normalitet i R

Mellem de kantede parenteser, kan du bruge en logisk vektor til at vælge de sager, du ønsker. Her vælges alle tilfælde, hvor den variable activ lig 1 for den første prøve, og alle tilfælde, hvor denne variabel er lig med 0 for den anden prøve.

Sådan bruger en R QQ plot for at kontrollere for data normalitet

I de fleste tilfælde du donâ € t ønsker at sammenligne to prøver med hinanden, men sammenligne en prøve med en teoretisk prøve, der kommer fra en bestemt fordeling (f.eks normalfordelingen).

For at gøre en QQ plot denne måde, R har den specielle qqnorm () funktion. Som navnet antyder, er denne funktion plotter din prøve mod en normalfordeling. Du skal blot give prøven du vil plotte som et første indlæg og tilføje grafiske parametre, du kan lide.

R opretter derefter en prøve med værdier, der kommer fra den standard normalfordeling, eller en normalfordeling med en middelværdi på nul og en standardafvigelse på en. Med denne anden prøve, R skaber QQ plot som forklaret før.

R har også en funktion qqline (), som tilføjer en linje til din normale QQ plot. Denne linje gør det meget lettere at vurdere, om du ser en klar afvigelse fra normalitet. Jo tættere alle punkter ligger på linje, jo tættere fordelingen af ​​din prøve kommer til normalfordelingen. Den qqline () funktion tager også prøven som et argument.

Nu du ønsker at gøre dette for de temperaturer under både den aktive og den inaktive periode af bæver. Du kan bruge qqnorm () funktion to gange for at skabe både plots. For de inaktive perioder, kan du bruge følgende kode:

> Qqnorm (beaver2 $ temp [beaver2 $ Activ == 0], vigtigste = "inaktiv")
> Qqline (beaver2 $ temp [beaver2 $ Activ == 0])

Du kan gøre det samme for den aktive periode ved at ændre værdien fra 0 til 1.

Sådan bruges Fraktilværdier Plots at kontrollere oplysninger Normalitet i R


© 2023 Zajacperrone.com | Contact us: webmaster# zajacperrone.com