Dvosmerna ANOVA v R - Dvosmerni ANOVA test v R Easy Guide - Primeri

Kazalo:

Anonim

Pregled dvosmerne ANOVA v R

Dvosmerna ANOVA (analiza variance) nam pomaga razumeti odnos med eno stalno odvisno spremenljivko in dvema kategoričnimi neodvisnimi spremenljivkami. V tej temi bomo spoznali dvotirno ANOVA v R.

Spodaj je predstavljena hipoteza zanimanja v okviru dvosmerne ANOVA

  1. H₀: poimenujemo glavni učinek, ki je prvi dejavnik, ki je odvisen od neprekinjene spremenljivke
  2. H₀: Glavni učinek je tudi vpliv druge spremenljivke na odvisno neprekinjeno spremenljivko.
  3. H₀: Interakcija je kombinirani učinek obeh spremenljivk prvega faktorja na odvisno spremenljivko

Spodaj so navedene norme, ki jih mora izpolnjevati dvosmerna ANOVA.

  1. Opažanja morajo biti neodvisna
  2. Opazovanja je treba normalno razdeliti.
  3. V pripombah bi moralo biti enako odstopanje
  4. Brez odtenkov v oblikovanju
  5. Napake morajo biti neodvisne.

Opomba

Če moramo kršiti normalnost in enake razlike, moramo spremeniti svoje podatke.

Primer dvosmerne ANOVA v R

Naredimo en način ANOVA testa na nizu podatkov o raku, ki vsebuje 48 vrstic in 3 podatkovne spremenljivke:

Vzeti čas: Čas preživetja živali

Različne stopnje raka 1 - 3

Zdravljenje: Zdravljenja, ki se uporabljajo od 1-3

Preden testiramo, potrebujemo naslednje podatke.

  • Uvoz podatkov
  • Odstranite nepotrebno spremenljivko
  • Pretvorite spremenljivke (ravni raka) kot urejeno raven.

Spodaj je nabor podatkov.

Opažanja: 48

Spremenljivke: 3

čas za preživetje 0, 31, 0, 45, 0, 46, 0, 43, 0, 36, 0, 29, 0, 40, 0, 23, 0, 22, 0…

ravni raka 1, 1, 1, 1, 2, 2, 2, 3, 3, 3, 3, 1, 1, 1, 1, 2, 2, 2…

Zdravljenje A, A, A, A, A, A, A, A, A, A, A, B, B, B, B, B, B, …

Cilji

  1. H₀: ni spremembe povprečnega časa preživetja med skupino
  2. H₀: čas preživetja je vsaj za eno skupino drugačen.

Koraki

  • Preverite rak. Lahko vidimo tri vrednosti znakov, ker jih pretvorimo v dejavnike z glagolom, ki mutira.

levels(df$cancerlevels)
output: (1) "1" "2" "3"

  • Izračunajte povprečni in standardni odklon

df % > %
group_by(cancerlevels) % > %
summarise(
count_ cancerlevels = n(),
mean_time = mean(time, na.rm = TRUE),
sd_time = sd(time, na.rm = TRUE)
)

Izhod:

Obleka: 3 x 4

rakuni ravni count_cancerlevels mean_time sd_time

1 1 16 0, 617500 0, 20942779

2 2 16 0, 544375 0, 28936641

3 3 16 0, 276250 0, 06227627

  • V tretjem koraku lahko grafično preverite, ali obstaja razlika med distribucijami. Upoštevajte, da vključite raztreseno piko.
  • Zaženite test z ukazom AOV.

aov(formula, data)
Arguments:
- formula: The equation you want to estimate
- data: The dataset used

Sintaksa:

y ~ X1 + X2 +… + Xn (X1 + X2 +… se nanaša na neodvisne spremenljivke)

y ~. Vse preostale spremenljivke uporabite kot neodvisne spremenljivke

Poskrbite, da boste shranili model in natisnili povzetek.

Koda

  • aov (čas-rak, podatki = df): Zaženite test ANOVA z naslednjo formulo
  • povzetek (anova_one_way): Natisnite povzetek testa

Df Vsota Sq Srednja vrednost Sq F Pr (> F)

Cancerlevels 2 1.033 0.5165 11.79 7.66e-05 ***

Preostali člani 45 1.972 0.0438

-

Signif. kode: 0 '***' 0, 001 '**' 0, 01 '*' 0, 05 '.' 0, 1 '' 1

P-vrednost je nižja od praga 0, 05. Statistična razlika je v zgornjem primeru označena s »*«.

Enosmerni test za dvosmerno Anovo v R

Poglejmo, kako je mogoče enosmerni test razširiti na dvosmerni ANOVA. Test je podoben enosmerni ANOVA, vendar se formula razlikuje in formuli doda drugo spremenljivko skupine.

y = x1 + x2

  • H0 : Sredstva so za obe spremenljivki enaka (faktorske spremenljivke)
  • H3 : Sredstva so za obe spremenljivki različna

V naš model dodate spremenljivke obdelave. Ta spremenljivka označuje zdravljenje, ki je bilo dodeljeno pacientu. Zanima vas, ali je med rakom in zdravljenjem bolnika statistična odvisnost.

Kodo prilagodimo tako, da dodamo poslastico z drugo neodvisno spremenljivko.

Df Vsota Sq Srednja vrednost Sq F Pr (> F)

Stopnje raka 2 1.0330 0.5165 20.64 5.7e-07 ***

Privoščite 3 0.9212 0.3071 12.27 6.7e-06 ***

Preostali 42 1.0509 0.0250

Obe ravni raka in zdravljenje se statistično razlikujejo od 0. S tem lahko zavrnemo hipotezo NULL. Prav tako potrdite, da sprememba zdravljenja ali vrste raka vpliva na čas preživetja.

Test

Enosmerna ANOVA: H3- Povprečna vrednost je vsaj za eno skupino

Dvosmerna ANOVA: H3- povprečje je za obe skupini drugačno.

Razlika med enosmernim in dvosmernim ANOVA

Razlike med enosmerno ANOVA in dvosmerno ANOVA

Enosmerna ANOVADvosmerna ANOVA
Zasnovan za omogočanje testiranja enakosti med 3 ali več sredstviZasnovan za oceno medsebojne povezanosti dveh neodvisnih spremenljivk na odvisni spremenljivki.
Vključuje eno neodvisno spremenljivkoVključuje dve neodvisni spremenljivki
Analizirano v 3 ali več kategoričnih skupinah.Primerja več skupin dveh dejavnikov
Izpolniti mora dva načela - podvajanje in randomizacijoIzpolniti mora tri načela, ki so podvajanje, randomizacija in lokalni nadzor.

Prednosti Dvosmerne ANOVA

  • V zgornjem primeru starost in spol v našem primeru pomagata zmanjšati odstopanje napak, s čimer je zasnova bolj učinkovita.
  • Dvosmerna ANOVA nam omogoča, da hkrati preizkusimo učinek dveh dejavnikov.

Prijave ANOVA

  1. Primerjava prevoženih kilometrov različnih vozil, goriv in cest.
  2. Spoznavanje vpliva temperature, tlaka ali koncentracije kemikalije na nekatere kemične reakcije (reaktorji moči, kemične naprave itd.)
  3. Vpliv različnih katalizatorjev na hitrost kemijske reakcije
  4. Razumevanje vpliva reklam in različnega števila odzivov strank.
  5. Vpliv zmogljivosti, kakovosti in hitrosti proizvodnje v biologiji (postopek temelji na številu celic, ki jih razdelijo)

Priporočeni članki

To je vodnik za Dvosmerno ANOVA v R. Tukaj razpravljamo o primerih, ciljih, korakih in razliki med Enosmerno in dvosmerno ANOVO. Za več informacij si lahko ogledate tudi naslednje članke -

  1. ANOVA v R
  2. Kako razlagati rezultate s testom ANOVA
  3. Regresija proti ANOVA
  4. GLM v R