r 53

R - sqldf

sqldf SQL을 이용해서 데이터를 처리 sqldf 라이브러리 설치 및 임포트 install.packages("sqldf") library(sqldf) sqldf 사용 예 # emp 테이블에서 사원번호 출력 sqldf("select employee_id from emp") # 부서번호가 20인 사원들의 사원번호 출력 sqldf("select employee_id from emp where department_id=20") # 부서번호들의 중복을 제거하고 출력 sqldf("select distinct department_id from emp") # 부서번호가 30인 사원들의 모든 정보 출력. 급여를 내림차순으로 정렬 sqldf("select * from emp where department_id=30 o..

인공지능/R 2020.04.17

R - dplyr 라이브러리 ② summarise , group_by

summarise : 주어진 데이터 집계 # 전체데이터의 집계값을 구하는 방법 emp%>% summarise(sum_sal = sum(SALARY)) # 여러가지 집계값 구하기 emp%>% summarise(sum_sal = sum(SALARY), avg_sal = mean(SALARY)) # summarise_at 사용 emp%>% summarise_at(c('SALARY','COMMISSION_PCT'), c(sum,mean),na.rm=T) # summarise_if : 조건에 맞는 데이터에 함수를 전부 적용함emp%>% summarise_if(is.numeric,sum,na.rm=T) emp%>% summarise_if(is.integer,sum,na.rm=T) group_by 그룹핑할 컬럼을 나..

인공지능/R 2020.04.17

R - dplyr 라이브러리 ① filter, select, arrange, %>%, mutate

dplyr 라이브러리 filter : 조건을 이용해서 필터링하는 함수 select : 여러컬럼이 있는 데이터 프레임에서 특정한 열만 선택하는 함수 arrange : 정렬 %>% : 여러문장을 조합해서 사용하는 방법을 제공(파이프) mutate : 새로운 컬럼을 추가하는 함수 # dplyr 라이브러리 임포트 library(dplyr) 1. filter # 기본 사용법 filter(emp, DEPARTMENT_ID==20) # 출력 컬럼 지정 filter(emp, DEPARTMENT_ID==20)[,c('LAST_NAME','SALARY')] 2. select # 기본 사용법 select(emp,LAST_NAME,SALARY) select(emp,1,2) # 출력 컬럼 인덱스 번호로 사용 select(emp..

인공지능/R 2020.04.16

R - subset / ddply

subset 조건에 만족하는 데이터를 선택하는 함수 단일값만 비교 가능 subset(데이터프레임, 조건, select=뽑아낼 컬럼) # 기본 사용법 subset(emp,DEPARTMENT_ID==20) # 원하는 컬럼만 뽑아낼때 따옴표를 사용하지 않아도 된다. subset(emp,DEPARTMENT_ID==20,select=c(LAST_NAME,SALARY)) subset(emp,DEPARTMENT_ID==20,select=c('LAST_NAME','SALARY')) # 데이터 프레임으로 비교할수없다 # 오류나진 않지만 원하는 값이 아니다. subset(emp,SALARY > subset(emp,EMPLOYEE_ID==101,select=SALARY)) # 단일값만 비교 가능 subset(emp,SALA..

인공지능/R 2020.04.16

R - 전역변수 / 지역변수

# 현재 만들어져있는 생성자들 확인 (파이썬에서는 dir) ls() # 생성자 삭제 rm(생성자 이름) # 생성자 전부 삭제 rm(list=ls()) 전역변수(global variable) 프로그램(세션이 열려 있는 동안에) 전체에서 사용할 수 있는 변수 함수에 상관없이 프로그램 전체에서 사용할 수 있는 변수 지역변수(private variable, local variable) 함수내에서 정의되고 사용할 수 있는 변수 # 전역변수 x

인공지능/R 2020.04.15

R - 조건 제어문

1. if문 if(조건){조건에 참일때 수행 } else{조건에 거짓일때 수행 } if(TRUE){print("참")} if(FALSE){print("참")} if(TRUE){print("참") }else{print(거짓) } # else문 안에 또 if문을 사용할 수 있다. x = 100 y = 100 if(x==y){ print("x와 y가 같다") } else { if (x>y){ print("x가 y보다 크다") } else{ print("y가 x보다 크다") } } 2. ifelse 함수 ifelse(조건, 참, 거짓) # ifelse함수를 사용하면 if문을 한 줄로 쓸 수 있다. x=5 y=10 ifelse(x==y,"같다","다르다") ifelse(x==y,"같다",ifelse(x>y,"x가..

인공지능/R 2020.04.13
반응형