그룹 함수
# 그룹 함수 계산 x <- c(70,80,60,90) sum(x) # 합 mean(x) # 평균 var(x) # 분산 sd(x) # 표준편차 max(x) # 최대값 min(x) # 최소값 length(x) # 길이 NROW(x) # 길이 |
|
# NA가 포함될때 그룹 함수 계산 x <- c(70,80,60,90,NA) sum(x) mean(x) var(x) sd(x) max(x) min(x) length(x) NROW(x) |
|
# na.rm = TRUE : NA값 제거 x <- c(70,80,60,90,NA) sum(x, na.rm=FALSE) sum(x, na.rm=TRUE) mean(x, na.rm=T) var(x, na.rm=T) sd(x, na.rm=T) max(x, na.rm=T) min(x, na.rm=T) length(x) # na를 포함한 개수 NROW(x) # na를 포함한 개수 length(na.omit(x)) # na를 포함하지 않는 개수 NROW(na.omit(x)) |
|
# select sum(salary) from emp; sum(emp$SALARY) sum(emp$COMMISSION_PCT,na.rm=T) |
aggregate()
- 데이터를 분할하고 각 그룹으로 묶은 후 그룹함수를 적용한다.
- aggregate(그룹함수 젹용 컬럼 ~ 분할해야할 컬럼, 데이터프레임, 그룹함수)
# select department_id, sum(salary)
aggregate(SALARY ~ DEPARTMENT_ID,emp,sum) |
|
# select department_id, job_id, sum(salary)
aggregate(SALARY ~ DEPARTMENT_ID+JOB_ID,emp,sum) |
'컴퓨터 > R' 카테고리의 다른 글
R - 조건 제어문 (0) | 2020.04.13 |
---|---|
R - apply (0) | 2020.04.13 |
R - 중복 제거 / 정렬 (0) | 2020.04.13 |
R - 함수 ③ 날짜 함수 (0) | 2020.04.10 |
R - 함수 ② 숫자 함수 (0) | 2020.04.10 |