r 53

나이브베이즈(Naive Bayes) 분류

나이브베이즈(Naive Bayes) 데이터를 나이브하게 독립적인 사건으로 가정하고 이 독립사건을 베이즈이론에 대입시켜 가장 높은 확률의 레이블로 분류를 실행하는 알고리즘이다. 사전확률 정보를 이용하여 사후확률을 예측하는 이론 패턴분석에 주로 사용됨 P(A|B) : 어떤 사건 B가 일어났을때 사건 A가 일어날 확률 P(B|A) : 어떤 사건 A가 일어났을때 사건 B가 일어날 확률 P(A) : 어떤 사건 A가 일어날 확률 P(B) : 어떤 사건 B가 일어날 확률 P(B|A) = P(A∩B) / P(A) = P(A|B) * P(B) / P(A) P(A∩B) = P(A|B) * P(B) P(B∩A) = P(B|A) * P(A) 예) ADsP - 빈도 YES NO TOTAL 합격 33 19 62 불합격 26 12..

머신러닝 - 머신러닝 개요 / kNN

머신러닝 개요 1. 머신러닝(Machin Learning) 인간의 학습 능력과 같은 기능을 컴퓨터가 하게 만드는 기술 인공지능(AI) 연구분야의 하나이다. 인공지능이란 인간이 원래 가지고 있는 지적 능력을 컴퓨터가 하게 만드는 기술 소프트웨어 분류(classification) : 주어진 데이터를 분류 예측 : 과거의 수치를 기반으로 미래의 수치 예측(회귀) 군집(ciustering) : 데이터를 비슷한 집합으로 분류 2. 지도학습(Supervised Learning) 레이블이 달려 있고 정해져 있는 데이터를 가지고 학습 이미지(개, 고양이), 스팸/햄 메일, 시험 성적 예측 regression : 예측 binary classification : 합격/불합격, 개/고양이, 암/양성 multi classif..

R - RSelenium, xlsx 사용

준비단계 1. RSelenium 설치 및 임포트 install.packages("RSelenium") library(RSelenium) !!주의사항!! jar는 java 환경설정이 되어 있어야한다. java 설치 확인 java -version 2. 가상 서버 가동하기 - 관리자 권한으로 실행 cd 저장해둔 위치 Java -Dwebdriver.gecko.driver="geckodriver.exe" -jar selenium-server-standalone-4.0.0-alpha-1.jar -port 4445 끝날때까지 창 띄워두기 RSelenium 사용 다나와 사이트에서 노트북(애플) 제품명, 가격, 정보 뽑아내기 # 가상서버에서 크롬으로 연결 remdr % html_text() prod_name # 제품가격..

인공지능/R 2020.04.28

R - KoNLP 설치 및 사용

1. KoNLP 설치 install.packages("KoNLP") 위 코드로 설치시 오류가 난다. 그럴땐 다음과 같은 방법으로 KoNLP를 설치하면 된다. 1) KoNLP 파일을 다운로드 받는다. 혹시 다운로드가 안되거나 다른 버전을 사용하고 싶다면 아래의 링크에서 직접 다운로드 받으면 된다. https://cran.r-project.org/src/contrib/Archive/KoNLP/ Index of /src/contrib/Archive/KoNLP cran.r-project.org 2) R 라이브러리 위치에 다운로드한 파일을 옮겨 놓는다. # R 라이브러리 위치 확인 .libPaths() 3) RStudio에서 KoNLP 라이브러리를 불러온다. # KoNLP 라이브러리 불러오기 library(KoN..

인공지능/R 2020.04.25
반응형