Sådan Evaluer Linear data med R

Naturligvis R giver en hel række forskellige tests og foranstaltninger til at vurdere, hvor godt din model passer til dine data samt kig på modellens antagelser. Igen oversigten præsenteres her er langt fra afsluttet, men det giver dig en idé om, hvad der er muligt, og et udgangspunkt for at se nærmere på problemet.

Sådan opsummere modellen

Resuméet () -funktionen straks returnerer du F-test for modeller konstrueret med AOV (). For LM () modeller, det er lidt anderledes. Tag et kig på outputtet:

> Model.summary <- resumé (Model)
> Model.summary
Ring:
lm (formel = mpg ~ WT data = mtcars)
Rester:
Min 1Q Median 3Q Max
-4,5432 -2,3647 -0,1252 1,4096 6,8727
Koefficienter:
Skøn Std. Fejl t-værdi Pr (> | t |)
(Intercept) 37,2851 1,8776 19,858 <2e-16 ***
vægt -5,3445 0,5591 -9,559 1.29e-10 ***
---
Bety. koder: 0 "***" 0,001 "**" 0,01 "*" 0.05 ".« 0.1 '' 1
Residualstandardafvigelsen: 3,046 på 30 frihedsgrader
Multiple R-squared: 0,7528, Justeret R-squared: 0,7446
F-statistik: 91,38 den 1. og 30. DF, p-værdi: 1.294e-10

Det er en hel masse nyttige oplysninger. Her kan du se følgende:

  • Fordelingen af ​​residualerne, som giver dig en første idé om, hvor godt de antagelser en lineær model hold
  • Koefficienterne ledsaget af en t-test, som fortæller dig i, hvor langt hver koefficient adskiller sig væsentligt fra nul
  • De goodness-of-fit foranstaltninger R2 og den justerede R2
  • F-test, som giver dig en idé om, hvorvidt din model forklarer en væsentlig del af variansen i dine data

Du kan bruge coef () til at udtrække en matrix med estimaterne, standardfejl og t-værdi og p-værdi for koefficienterne fra sammenfattende objekt som dette:

> Coef (Model.summary)
Skøn Std. Fejl t-værdi Pr (> | t |)
(Intercept) 37,285126 1,877627 19,857575 8.241799e-19
wt -5,344472 0,559101 -9,559044 1.293959e-10

Hvis disse betingelser ikke fortæller dig noget, slå dem op i en god kilde om modellering. For en omfattende introduktion til anvendelse og fortolkning lineære modeller korrekt, tjek Applied Linear statistiske modeller 5th Edition af Michael Kutner et al (McGraw-Hill / Irwin).

Hvordan til at teste virkningen af ​​model vilkår

For at få en variansanalyse tabel - ligesom resuméet () funktionen gør det til en ANOVA model - du blot bruge ANOVA (), og give det den lm () model objekt som argument, som denne:

> Model.anova <- ANOVA (Model)
> Model.anova
Variansanalyse Table
Svar: MPG
Df Sum Sq Mean Sq F-værdi Pr (> F)
vægt 1 847,73 847,73 91,375 1.294e-10 ***
Rester 30 278,32 9,28
---
Bety. koder: 0 "***" 0,001 "**" 0,01 "*" 0.05 ".« 0.1 '' 1

Her den resulterende objekt er en data frame, der gør det muligt at udtrække nogen værdi fra tabellen ved hjælp delmængdebetingelserne og indeksering værktøj. For eksempel, for at få p-værdi, kan du gøre følgende:

> Model.anova ['vægt', 'Pr (> F)']
[1] 1.293959e-10

Du kan fortolke denne værdi som sandsynligheden for, at tilføje variablen wt til modellen gør ikke en forskel. Den lave p-værdi her indikerer, at vægten af ​​en bil (wt) forklarer en betydelig del af forskellen i kilometer (MPG) mellem biler. Dette bør ikke komme som en overraskelse; en tungere bil gør faktisk brug for mere magt til at trække sin egen vægt omkring.

Du kan bruge ANOVA () til at sammenligne forskellige modeller så godt, og mange modellering pakker giver denne funktionalitet. Du finder eksempler på dette på de fleste af de relaterede Hjælp sider som? Anova.lm og? Anova.glm.


© 2020 Zajacperrone.com | Contact us: webmaster# zajacperrone.com