R: 분산 분석

R에서 분산 분석은 aov 함수를 사용한다. 샘플 데이터 중에 CO2를 사용해서 분산분석을 해보자.

> data(CO2)

상자 그림을 그려보자.

> boxplot(uptake ~ Type, data=CO2)

이제 분석을 해보자. aov함수에는 관계식과 데이터를 받는다. 관계식은 "종속변수 ~ 독립변수" 형태로 쓴다. Type에 따라 uptake가 달라지는 지 알고 싶다면 uptake ~ Type이라고 쓴다.

> ca = aov(uptake ~ Type, CO2)

분산분석의 결과가 ca 변수에 저장되었다. 내용을 보고 싶다면 summary() 함수를 사용한다.

> summary(ca)
            Df Sum Sq Mean Sq F value    Pr(>F)    
Type         1 3365.5  3365.5  43.519 3.835e-09 ***
Residuals   82 6341.4    77.3                      
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1