R: 상관 분석(correlation)

피어슨 상관계수

R에서 상관분석은 cor.test 함수를 사용한다. 사용법은 대단히 간단하다. 두 변수 x와 y의 피어슨 상관계수를 구하려면 단순히 다음과 같이 하면 된다.

cor.test(x,y)

결과는 다음과 같다.

        Pearson's product-moment correlation

data:  x and y 
t = 12.3142, df = 48, p-value = 2.220e-16
alternative hypothesis: true correlation is not equal to 0 
95 percent confidence interval:
 0.7831722 0.9253898 
sample estimates:
      cor 
0.8715312 

대립가설

위의 예는 영가설을 p=0, 대립가설을 p≠0으로 두었다. 이것을 바꾸고 싶으면 alternative 옵션을 사용한다. 대립가설이 p<0이면 alternative="less", p>0이면 alternative="greater"라고 쓴다.

cor.test(x, y,alternative="less")
cor.test(x, y,alternative="greater")

신뢰구간

신뢰구간은 기본이 95%이다. 바꾸고 싶다면 conf.level 옵션을 사용한다. 다음은 신뢰구간을 99%로 설정한 경우다.

cor.test(x,y,conf.level=0.99)

스피어만 상관계수와 켄달 상관계수

피어슨 상관계수 대신 스피어만 상관계수 ρ나 켄달 상관계수 τ를 구하고 싶으면 method 옵션을 사용한다.

cor.test(x,y,method="spearman") # 스피어만 상관계수
cor.test(x,y,method="kendall") # 켄달 상관계수

관계식

다른 모형과 마찬가지로 상관분석도 관계식을 사용할 수 있다. 종속변수 자리는 비워두고 분석할 변수들을 독립변수로 써준다.

cor.test(~ x + y)

참고

  1. 다른 통계방법들
  2. 상관분석