컴퓨터/R

R - 그룹 함수

해피밀세트 2020. 4. 13. 17:29

 

 

그룹 함수

# 그룹 함수 계산

x <- c(70,80,60,90)

sum(x)      # 합

mean(x)    # 평균

var(x)        # 분산

sd(x)        # 표준편차

max(x)      # 최대값

min(x)       # 최소값

length(x)    # 길이

NROW(x)   # 길이

# NA가 포함될때 그룹 함수 계산

x <- c(70,80,60,90,NA)

sum(x) 

mean(x)

var(x) 

sd(x)  

max(x) 

min(x)

length(x)

NROW(x)

# na.rm = TRUE : NA값 제거

x <- c(70,80,60,90,NA)

sum(x, na.rm=FALSE)

sum(x, na.rm=TRUE)

mean(x, na.rm=T)

var(x, na.rm=T) 

sd(x, na.rm=T)  

max(x, na.rm=T) 

min(x, na.rm=T)

length(x)            # na를 포함한 개수

NROW(x)            # na를 포함한 개수

length(na.omit(x)) # na를 포함하지 않는 개수

NROW(na.omit(x))

# select sum(salary) from emp;

sum(emp$SALARY)

sum(emp$COMMISSION_PCT,na.rm=T)

 

aggregate()

  • 데이터를 분할하고 그룹으로 묶은 그룹함수를 적용한다.
  • aggregate(그룹함수 젹용 컬럼 ~ 분할해야할 컬럼, 데이터프레임, 그룹함수)

# select department_id, sum(salary)
   from emp
   group by department_id;

 

aggregate(SALARY ~ DEPARTMENT_ID,emp,sum)

# select department_id, job_id, sum(salary)   
   from emp

   group by department_id, job_id;

 

aggregate(SALARY ~ DEPARTMENT_ID+JOB_ID,emp,sum)

 

반응형

'컴퓨터 > R' 카테고리의 다른 글

R - 조건 제어문  (0) 2020.04.13
R - apply  (0) 2020.04.13
R - 중복 제거 / 정렬  (0) 2020.04.13
R - 함수 ③ 날짜 함수  (0) 2020.04.10
R - 함수 ② 숫자 함수  (0) 2020.04.10