SPSS

소개

SPSS는 사회과학 분야에서 널리 쓰이는 통계 패키지로서 쉽고 간편하다. 여기서는 SPSS 12.0 한글판을 기준으로 설명한다. SPSS의 메뉴 구성은 크게 달라지지 않았으므로 이후 버전이나 영문판에서도 거의 비슷한 방법으로 쓸 수 있다. 2007년 5월 현재 SPSS 최신 버전은 15.0이다.

홈페이지: http://www.spss.com

통계 분석

  1. 분산 분석(ANOVA)
  2. 상관 분석(correlation)

Maxima

Maxima는 무료로 자유롭게 사용할 수 있는 컴퓨터 대수 시스템(computer algebra system)이다. 비슷한 상용프로그램은 Mathematica가 있다.

사용례

Maxima를 시작하면 다음과 같은 표시가 뜬다. 이것은 입력(input)을 기다린다는 표시로서 프롬프트(prompt)라고 한다. 마지막의 숫자 1은 이것이 첫 번 째 입력이라는 뜻이다.

(%i1) 

여기에 x2-1을 나타내는 x^2-1을 입력하자.

(%i1) x^2-1;
(%o1) x^2-1

%o는 출력(output)을 나타낸다. 여기서는 Maxima에 수식 하나를 등록한 것이다. 이제 이 수식을 인수분해해보자. 다음 명령어를 직접 입력하거나 메뉴에서 factor를 선택하면 다음과 같이 인수분해를 한다. %는 바로 앞의 수식을 가리킨다. 따라서 아래 입력의 %는 %o1을 말한다.

R: 자료를 부분으로 나누어 처리하기

subset - 원하는 부분만 골라내기

> 신체검사
  이름 성별  키 몸무게
1 철수   남 180     80
2 영수   남 170     77
3 민수   남 160     65
4 영희   여 170     57
5 진희   여 160     50
6 민희   여 150     44

만약 키가 160이상인 사람들의 자료만 보려고 한다면 다음과 같이 subset 함수를 사용할 수 있다.

> subset(신체검사,키 > 160)
  이름 성별  키 몸무게
1 철수   남 180     80
2 영수   남 170     77
4 영희   여 170     57

물론 []를 사용하여 다음과 같이 표현할 수도 있다.

로제타 석: R과 Matlab 비교

R, Matlab 명령어 비교

행렬

Selected Answers of Fraleigh's A FirstCourse In Abstract Algebra (7th ed.)

If you find anything wrong in this answers, please mail euphoris at gmail.com

Matrix Notation

[a b; c d] = | a  b |
                | c  d |

Answers

1.38

exp(ia)exp(ib)
= (sin(a) + icos(a))(sin(b) + icos(b))
= (sin(a)sin(b) - cos(a)cos(b)) + i(sin(a)cos(b) + cos(a)sin(b))

exp(ia)exp(ib)
= exp(i(a+b))
= sin(a+b) + icos(a+b)

∴ sin(a+b) = sin(a)sin(b) - cos(a)cos(b)
   cos(a+b) = sin(a)cos(b) + cos(a)sin(b)

2.13

[code]
When n(S) = n,

텍스트 산점도

이미지

코드

png("text-scatter.png",500,500)
attach(USArrests)
plot(Murder ~ UrbanPop, type="n")
text(Murder ~ UrbanPop, row.names(USArrests))
detach(USArrests)
dev.off()

해설

plot(Murder ~ UrbanPop, type="n")

plot에서 type을 "n"으로 하면 그래프에 아무 것도 출력하지 않는다. 크기를 확보하기 위해서 사용한다.

text(Murder ~ UrbanPop, row.names(USArrests))

text는 그래프에 글자를 출력한다. row.names 함수는 데이터프레임의 행 이름을 뽑아주는 함수이다.

Java를 이용한 수치해석

소개

자바(Java)는 현재 세계에서 가장 많이 사용되는 프로그래밍 언어로서 선 마이크로시스템즈(Sun Microsystems)社가 만들었다.

자바는 C++과 비슷한 문법을 가지면서도 배우고 사용하기 쉬울 뿐만 아니라 가상 기계(virtual machine) 위에서 작동하기 때문에 한 번만 프로그램을 작성하면 여러 종류의 하드웨어나 운영체제에서 돌릴 수 있다.

R: 자료 불러들이기

R에서 자료를 불러들이는 방법에는 크게 세 가지가 있다.

첫째, 직접 입력하기
둘째, 복사해서 붙이기
셋째, 파일에서 불러오기

복사해서 붙이기

복사해서 붙이는 방법은 간단하다. 엑셀에서 데이터를 입력하고 원하는 부분을 선택하고 Ctrl-C를 눌러서 복사를 한다.

통계: 회귀분석

회귀분석이란 변수들 사이의 관계식을 추정하는 통계 방법이다. 가설검정이나 분산분석은 회귀분석의 특수한 경우로 볼 수 있고 요인분석이나 위계적 선형모형, 구조방정식 모형은 회귀분석의 확장으로 볼 수 있기 때문에 회귀분석만 이해하면 사회과학에서 사용하는 통계방법의 대부분을 이해하는 것이나 다름없다.

참고

  1. 다른 통계방법들

패키지별 회귀분석

  1. R

R: 혼합 효과 모형(Mixed Effect Model)

간략한 이론

혼합 효과 모형(Mixed Effect Model)은 고정 효과(fixed effect)와 무선 효과(random effect)을 이용하여 종속변수를 설명한다. 아래에서 A는 고정 효과, B는 무선 효과이다.

Y = AX + BZ + e

HLM 또는 다층 모형(Multilevel Model)은 집단과 개인, 개인과 시행처럼 위계적인 형태를 띄고 있는 자료를 분석하기 위한 모형이다. 아래의 모형을 보면 절편(β0)과 회귀계수(β1)가 또다른 회귀식의 형태를 띄고 있다.

[code]

내용묶음
MATLABR
새 행렬
A = [1 2; 3 4]

B = [1 2
       3 4]
a = matrix(c(1,2,3,4),nrow=2,byrow=T)

b = c(1,3,2,4)
dim(b) = c(2,2)
덧셈
A+B
a + b
뺄셈
A - B
a - b
행렬 곱셈
A * B