컴퓨터/R

R - KoNLP 설치 및 사용

해피밀세트 2020. 4. 25. 19:36

 

 

 

1. KoNLP 설치

 

install.packages("KoNLP")

위 코드로 설치시 오류가 난다.

그럴땐 다음과 같은 방법으로 KoNLP를 설치하면 된다.

 

 

1) KoNLP 파일을 다운로드 받는다.

 

KoNLP.zip
5.63MB

혹시 다운로드가 안되거나 다른 버전을 사용하고 싶다면 아래의 링크에서 직접 다운로드 받으면 된다.

https://cran.r-project.org/src/contrib/Archive/KoNLP/

 

Index of /src/contrib/Archive/KoNLP

 

cran.r-project.org

 

 

2) R 라이브러리 위치에 다운로드한 파일을 옮겨 놓는다.

 

# R 라이브러리 위치 확인

.libPaths()

 

 

3) RStudio에서 KoNLP 라이브러리를 불러온다.

 

# KoNLP 라이브러리 불러오기

library(KoNLP)

 

 

4) 오류가 안날때까지 관련 패키지를 전부 설치한다.

 

# 보통 아래의 패키지들을 다운받으면 된다.

install.packages("Sejong")

install.packages("hash")

install.packages("rJava")

Sys.setenv(JAVA_HOME="C:\\Program Files\\Java\\jdk1.8.0_102")

install.packages("tau")

install.packages("devtools")

 

# KoNLP 임포트 확인

library(KoNLP)

 

 


 

2. KoNLP 사용

 

text <- "R은 오픈소스로 통계, 기계학습, 금융, 생물정보학, 그래픽스에 이르는 다양한 통계 패키지를 갖추고 있는 좋은 프로그램이다."

# 명사만 뽑아내기
# 사전에 등록되어있지 않는 명사들이 분리되서 출력

extractNoun(text)

# 없는 명사를 사전에 등록하는 작업이 필요함.

buildDictionary(ext_dic = "sejong",

               user_dic = data.frame(c("기계학습","생물정보학",
                                              "다양한","오픈소스"),

                                      c("ncn")),replace_usr_dic=T)

# 다시 확인

extractNoun(text)

반응형

'컴퓨터 > R' 카테고리의 다른 글

R - 크롤링 연습 ①  (0) 2020.04.27
R - 크롤링  (0) 2020.04.27
R - stringr을 이용한 텍스트 정제 작업  (0) 2020.04.23
R - wordcloud  (0) 2020.04.23
R - 시각화 ⑤ ggplot 라이브러리 사용(히스토그램, 상자그림)  (0) 2020.04.23