분할표 (contingency table)
- 명목형, 순서형 데이터의 도수를 표로 나타낸다.
table()
: 데이터의 빈도수 체크
# 빈도수 체크 x <- c("A","B","A","A","C","B") table(x) |
|
# 합계도 출력 addmargins(table(x)) |
|
# 상대도수 prop.table(table(x)) |
|
# 최대값이 저장된 위치의 색인을 반환 # 최소값이 저장된 위치의 색인을 반환 which.min(table(x)) |
|
# 실제값 확인 table(x)[which.max(table(x))] table(x)[which.min(table(x))] |
|
# 색인만 확인하기 names(table(x))[which.max(table(x))] names(table(x))[which.min(table(x))] |
|
y <- xtabs(SALARY ~ JOB_ID+DEPARTMENT_ID,emp) 일때 | |
# 행방향의 합 margin.table(y,1) |
|
# 열방향의 합 margin.table(y,2) |
|
# 행방향의 비율 prop.table(y,1) |
|
# 열방향의 비율 prop.table(y,2) |
xtabs()
: 빈도수 체크 (table과 비슷하다.)
# 빈도수 체크 xtabs(~JOB_ID,emp) |
|
# 급여의 합 xtabs(SALARY~JOB_ID,emp) tapply(emp$SALARY,emp$JOB_ID,sum,default=0) |
반응형
'컴퓨터 > R' 카테고리의 다른 글
R - 시각화 ② scatter plot, histogram (0) | 2020.04.21 |
---|---|
R - 시각화 ① pie chart, bar graph (0) | 2020.04.20 |
R - grep과 정규표현식 (0) | 2020.04.17 |
R - melt / dcast (0) | 2020.04.17 |
R - sqldf (0) | 2020.04.17 |