Pregled dvosmerne ANOVA v R
Dvosmerna ANOVA (analiza variance) nam pomaga razumeti odnos med eno stalno odvisno spremenljivko in dvema kategoričnimi neodvisnimi spremenljivkami. V tej temi bomo spoznali dvotirno ANOVA v R.
Spodaj je predstavljena hipoteza zanimanja v okviru dvosmerne ANOVA
- H₀: poimenujemo glavni učinek, ki je prvi dejavnik, ki je odvisen od neprekinjene spremenljivke
- H₀: Glavni učinek je tudi vpliv druge spremenljivke na odvisno neprekinjeno spremenljivko.
- H₀: Interakcija je kombinirani učinek obeh spremenljivk prvega faktorja na odvisno spremenljivko
Spodaj so navedene norme, ki jih mora izpolnjevati dvosmerna ANOVA.
- Opažanja morajo biti neodvisna
- Opazovanja je treba normalno razdeliti.
- V pripombah bi moralo biti enako odstopanje
- Brez odtenkov v oblikovanju
- Napake morajo biti neodvisne.
Opomba
Če moramo kršiti normalnost in enake razlike, moramo spremeniti svoje podatke.
Primer dvosmerne ANOVA v R
Naredimo en način ANOVA testa na nizu podatkov o raku, ki vsebuje 48 vrstic in 3 podatkovne spremenljivke:
Vzeti čas: Čas preživetja živali
Različne stopnje raka 1 - 3
Zdravljenje: Zdravljenja, ki se uporabljajo od 1-3
Preden testiramo, potrebujemo naslednje podatke.
- Uvoz podatkov
- Odstranite nepotrebno spremenljivko
- Pretvorite spremenljivke (ravni raka) kot urejeno raven.
Spodaj je nabor podatkov.
Opažanja: 48
Spremenljivke: 3
čas za preživetje 0, 31, 0, 45, 0, 46, 0, 43, 0, 36, 0, 29, 0, 40, 0, 23, 0, 22, 0…
ravni raka 1, 1, 1, 1, 2, 2, 2, 3, 3, 3, 3, 1, 1, 1, 1, 2, 2, 2…
Zdravljenje A, A, A, A, A, A, A, A, A, A, A, B, B, B, B, B, B, …
Cilji
- H₀: ni spremembe povprečnega časa preživetja med skupino
- H₀: čas preživetja je vsaj za eno skupino drugačen.
Koraki
- Preverite rak. Lahko vidimo tri vrednosti znakov, ker jih pretvorimo v dejavnike z glagolom, ki mutira.
levels(df$cancerlevels)
output: (1) "1" "2" "3"
- Izračunajte povprečni in standardni odklon
df % > %
group_by(cancerlevels) % > %
summarise(
count_ cancerlevels = n(),
mean_time = mean(time, na.rm = TRUE),
sd_time = sd(time, na.rm = TRUE)
)
Izhod:
Obleka: 3 x 4
rakuni ravni count_cancerlevels mean_time sd_time
1 1 16 0, 617500 0, 20942779
2 2 16 0, 544375 0, 28936641
3 3 16 0, 276250 0, 06227627
- V tretjem koraku lahko grafično preverite, ali obstaja razlika med distribucijami. Upoštevajte, da vključite raztreseno piko.
- Zaženite test z ukazom AOV.
aov(formula, data)
Arguments:
- formula: The equation you want to estimate
- data: The dataset used
Sintaksa:
y ~ X1 + X2 +… + Xn (X1 + X2 +… se nanaša na neodvisne spremenljivke)
y ~. Vse preostale spremenljivke uporabite kot neodvisne spremenljivke
Poskrbite, da boste shranili model in natisnili povzetek.
Koda
- aov (čas-rak, podatki = df): Zaženite test ANOVA z naslednjo formulo
- povzetek (anova_one_way): Natisnite povzetek testa
Df Vsota Sq Srednja vrednost Sq F Pr (> F)
Cancerlevels 2 1.033 0.5165 11.79 7.66e-05 ***
Preostali člani 45 1.972 0.0438
-
Signif. kode: 0 '***' 0, 001 '**' 0, 01 '*' 0, 05 '.' 0, 1 '' 1
P-vrednost je nižja od praga 0, 05. Statistična razlika je v zgornjem primeru označena s »*«.
Enosmerni test za dvosmerno Anovo v R
Poglejmo, kako je mogoče enosmerni test razširiti na dvosmerni ANOVA. Test je podoben enosmerni ANOVA, vendar se formula razlikuje in formuli doda drugo spremenljivko skupine.
y = x1 + x2
- H0 : Sredstva so za obe spremenljivki enaka (faktorske spremenljivke)
- H3 : Sredstva so za obe spremenljivki različna
V naš model dodate spremenljivke obdelave. Ta spremenljivka označuje zdravljenje, ki je bilo dodeljeno pacientu. Zanima vas, ali je med rakom in zdravljenjem bolnika statistična odvisnost.
Kodo prilagodimo tako, da dodamo poslastico z drugo neodvisno spremenljivko.
Df Vsota Sq Srednja vrednost Sq F Pr (> F)
Stopnje raka 2 1.0330 0.5165 20.64 5.7e-07 ***
Privoščite 3 0.9212 0.3071 12.27 6.7e-06 ***
Preostali 42 1.0509 0.0250
Obe ravni raka in zdravljenje se statistično razlikujejo od 0. S tem lahko zavrnemo hipotezo NULL. Prav tako potrdite, da sprememba zdravljenja ali vrste raka vpliva na čas preživetja.
Test
Enosmerna ANOVA: H3- Povprečna vrednost je vsaj za eno skupino
Dvosmerna ANOVA: H3- povprečje je za obe skupini drugačno.
Razlika med enosmernim in dvosmernim ANOVA
Razlike med enosmerno ANOVA in dvosmerno ANOVA
Enosmerna ANOVA | Dvosmerna ANOVA |
Zasnovan za omogočanje testiranja enakosti med 3 ali več sredstvi | Zasnovan za oceno medsebojne povezanosti dveh neodvisnih spremenljivk na odvisni spremenljivki. |
Vključuje eno neodvisno spremenljivko | Vključuje dve neodvisni spremenljivki |
Analizirano v 3 ali več kategoričnih skupinah. | Primerja več skupin dveh dejavnikov |
Izpolniti mora dva načela - podvajanje in randomizacijo | Izpolniti mora tri načela, ki so podvajanje, randomizacija in lokalni nadzor. |
Prednosti Dvosmerne ANOVA
- V zgornjem primeru starost in spol v našem primeru pomagata zmanjšati odstopanje napak, s čimer je zasnova bolj učinkovita.
- Dvosmerna ANOVA nam omogoča, da hkrati preizkusimo učinek dveh dejavnikov.
Prijave ANOVA
- Primerjava prevoženih kilometrov različnih vozil, goriv in cest.
- Spoznavanje vpliva temperature, tlaka ali koncentracije kemikalije na nekatere kemične reakcije (reaktorji moči, kemične naprave itd.)
- Vpliv različnih katalizatorjev na hitrost kemijske reakcije
- Razumevanje vpliva reklam in različnega števila odzivov strank.
- Vpliv zmogljivosti, kakovosti in hitrosti proizvodnje v biologiji (postopek temelji na številu celic, ki jih razdelijo)
Priporočeni članki
To je vodnik za Dvosmerno ANOVA v R. Tukaj razpravljamo o primerih, ciljih, korakih in razliki med Enosmerno in dvosmerno ANOVO. Za več informacij si lahko ogledate tudi naslednje članke -
- ANOVA v R
- Kako razlagati rezultate s testom ANOVA
- Regresija proti ANOVA
- GLM v R