Sådan at analysere data Afvigelser i modeller med R

En analyse af varians (ANOVA) er en meget udbredt teknik med R til at sammenligne midlerne mellem forskellige grupper af data. For at illustrere dette, tage et kig på datasættet InsectSpray:

> str (InsectSprays)
»Data.frame ': 72 obs. 2 variabler:
$ Tæller: num 10 7 20 14 14 12 10 23 17 20 ...
$ Spray: Faktor m / 6 niveauer "A", "B", "C", "D", ..: 1 1 1 1 1 1 1 1 1 1 ...

Dette datasæt indeholder resultaterne af en landbrugs eksperiment. Seks insekticider blev testet på 12 felter hver, og forskerne talt antallet af irriterende fejl, der forblev på hvert felt. Nu landmændene har brug for at vide, om de insekticider gøre nogen forskel, og hvis ja, hvilken en de bedst brug. Du besvare dette spørgsmål ved at bruge AOV () til at udføre en ANOVA.

Hvordan til at bygge modellen

For dette simple eksempel, bygge modellen er et stykke kage. Du væsentlige ønsker at modellere midler til variabel tæller som en funktion af den variable spray. Du oversætte det til R på denne måde:

> AOVModel <- AOV (count ~ spray, data = InsectSprays)

Du passerer to argumenter til AOV () funktion i denne linje kode:

  • Formlen tæller ~ spray, der lyder som "tæller som en funktion af spray"
  • Data Argumentet, hvor du angiver de data ramme, hvori variablerne i formlen kan findes

Hver modellering funktion returnerer en model objekt med en masse oplysninger om den model. Altid sætte denne model objekt i en variabel. På denne måde behøver du ikke at genmontere den model, når du har brug for at udføre ekstra beregninger.

Hvordan man ser på modellen objekt

Som med enhver genstand, kan du kigge på en model objekt blot ved at skrive sit navn i konsollen. Hvis du gør det for det objekt model, du har oprettet, vises følgende output:

> AOVModel
Ring:
AOV (formel = count ~ spray, data = InsectSprays)
Vilkår:
spray Rester
Sum af kvadrater 2668.833 1015.167
Deg. Frihed 5 66
Residualstandardafvigelsen: 3.921902
Anslåede virkninger kan være ubalanceret

Dette betyder ikke fortælle dig, at meget, bortset fra kommandoen (eller opkaldet) du brugte til at bygge modellen, og nogle grundlæggende oplysninger om montering resultat.

I output, du også læse, at de estimerede effekter kan være ubalanceret. Dette er ikke en advarsel - det er et budskab, der er bygget ind af forfatteren af ​​AOV () funktion. Denne ene kan poppe op i to situationer:

  • Du har ikke det samme antal sager i hver gruppe.
  • Du har ikke sat ortogonale kontraster.

I dette tilfælde er det den anden grund.


© 2019 Zajacperrone.com | Contact us: webmaster# zajacperrone.com