Sådan oprettes en to-vejs datatabel med R

En to-vejs tabel er en tabel, der beskriver to kategoriske data variabler sammen, og R giver dig et helt værktøjssæt til at arbejde med to-vejs tabeller. De indeholder antallet af sager for hver kombination af kategorierne i begge variable. Analysen af ​​kategoriske data begynder altid med tabeller. Men først, skal du oprette tabellerne.

Sådan oprettes en R datatabel fra to variabler

For eksempel, du ønsker at vide, hvor mange biler har tre, fire eller fem gear, men delt op til biler med automatgear og biler med manuelle gearkasser. Du kan gøre dette igen med hjælp af tabellen () funktionen med to argumenter, som denne:

> Med (biler, bord (AM, gear))
3 4 5
auto 0 8 5
manual 15 4 0

Niveauerne af den variabel, du giver som det første argument er rækken navne, og niveauet af den variabel, du giver som det andet argument er kolonnenavne. I tabellen, får du tæller for hver kombination. For eksempel kan du regne 15 biler med manuelle gearkasser og tre gear.

Sådan opretter R datatabeller fra en matrix

Forskere bruger også tabeller for mere alvorlig sag, som for at finde ud af, om en bestemt adfærd (ligesom rygning) har betydning for risikoen for at få en sygdom (fx lungekræft). På denne måde har du fire mulige tilfælde: risikoadfærd og syge, risikoadfærd og sunde, ingen risikoadfærd og sunde, eller ingen risiko adfærd og syge.

Ofte et resultat af en sådan undersøgelse består af tæller for hver kombination. Hvis du har tællingerne for alle tilfælde, kan du meget nemt oprette tabellen selv, sådan her:

> Retssag <- matrix (c (34,11,9,32), NcoI = 2)
> Colnames (trial) <- c ('syg', 'sund')
> Rownames (trial) <- c ("risiko", "no_risk ')
> Trial.table <- as.table (retssag)

Med denne kode, du gøre følgende:

  1. Opret en matrix med antallet af tilfælde for hver kombination af syge / sund og risiko / ingen risiko adfærd.
  2. Tilføj kolonnenavne at påpege, hvilken kategori tællingerne er for.
  3. Konvertere denne matrix til en tabel.

Resultatet ser sådan ud:

> Trial.table
syg sund
risiko 34 9
no_risk 11 32

En tabel som trial.table kan ses som et sammendrag af to variable. En variabel angiver, om personen er syg eller rask, og den anden variabel angiver, om personen viser risikobetonet adfærd.

Sådan udtrække data i R

Selvom tabeller og matricer er to forskellige dyr, kan du behandle en tovejs tabel som en matrix i de fleste situationer. Dette bliver praktisk, hvis du ønsker at udtrække værdier fra tabellen. Hvis du ønsker at vide, hvor mange mennesker blev syge og viste risikoadfærd, skal du blot gøre følgende:

> Trial.table ['risiko', 'syg']
[1] 34


© 2023 Zajacperrone.com | Contact us: webmaster# zajacperrone.com