Sådan bruges Anvend for at Opret Tabular Resuméer i R

02/06/2015 by admin

Du bruger tapply () for at oprette tabelform oversigter over data i R. Med tapply (), kan du nemt oprette resuméer af undergrupper i data. Denne funktion har tre argumenter:

  • X: En vektor
  • INDEX: En faktor eller liste over faktorer
  • FUN: En funktion

For eksempel beregne den gennemsnitlige bægerblad længde i datasættet iris:

> Tapply (iris $ Sepal.Length, iris $ Arter, mener)
setosa versicolor virginica
5,006 5,936 6,588

Med denne korte linje kode, du gør nogle stærke ting. Du fortæller R til at tage Sepal.Length kolonnen, opdele det efter art, og derefter beregne middelværdien for hver gruppe.

Dette er en vigtig formsprog til at skrive kode i R, og det normalt går under navnet Split, Anvend og Combine (SAC). I dette tilfælde skal du opdele en vektor i grupper, anvende en funktion til hver gruppe, og derefter kombinere resultatet i en vektor.

Selvfølgelig ved hjælp af med () funktion, kan du skrive din linje kode i en lidt mere læsbar måde:

> Med (iris, tapply (Sepal.Length, Arter, mener))
setosa versicolor virginica
5,006 5,936 6,588

Brug tapply (), du også kan oprette mere komplekse tabeller til at opsummere dine data. Det gør du ved hjælp af en liste som din INDEX argument.

Sådan bruger tapply () for at skabe højere dimensionelle tabeller

Prøv f.eks at opsummere datarammen mtcars, indbygget data ramme med data om motor-bilmotorer og ydeevne. Som med ethvert objekt, kan du bruge str () for at inspicere dets struktur:

> str (mtcars)

Variablen am er en numerisk vektor, som angiver, om motoren har en automatisk (0) eller manuel (1) gearkasse. Da dette ISNA € t meget beskrivende, starte med at oprette et nyt objekt, biler, der er en kopi af mtcars og ændre kolonnen er for at være en faktor:

> Biler <- indenfor (mtcars,
+ Am <- faktor (am, niveauer = 0: 1, etiketter = c ("Automatisk", "Manual"))
+)

Brug nu tapply () til at finde de gennemsnitlige miles per gallon (mpg) for hver type gearkasse:

> Med (biler, tapply (mpg, er, mener))
Automatisk Manuel
17,14737 24,39231

Ja, youâ € re korrekt. Det er stadig kun en endimensional tabel. Prøv nu at lave en todimensional tabel med den type gearkasse (am) og antal gear (gear):

> Med (biler, tapply (mpg, liste (gear, am), mener))
Automatisk Manuel
3 16,10667 NA
4 21,05000 26,275
5 NA 21,380

Du bruger tapply () for at oprette tabelform oversigter over data. Dette er en smule svarende til tabellen () funktion. Dog kan tabel () skabe kun kontingenstabeller (dvs. tabeller af optællinger), hvorimod med tapply () kan du angive nogen funktion som sammenlægning funktion. Med andre ord, med tapply (), kan du beregne tæller, midler eller andre værdi.

Hvis du ønsker at sammenfatte statistikker på en enkelt vektor, tapply () er meget nyttig og hurtig at bruge.

Sådan bruger aggregat ()

En anden R-funktion, der gør noget meget lignende er samlet ():

> Med (biler, aggregat (MPG, liste (gear = gear, am = AM), mener))
gear am x
1 3 Automatisk 16,10667
2 4 Automatisk 21,05000
3 4 Manual 26,27500
4 5 Manuel 21,38000

Dernæst du tager aggregat () til nye højder ved hjælp af formlen interface.


Relaterede Artikler

© 2018 - zajacperrone.com| Contact us: webmaster# zajacperrone.com