랜덤포레스트 2

와인품질데이터 - 의사결정트리 / 랜덤 포레스트

와인품질 데이터 컬럼 설명 fixed acidity : 고정 산도 volatile acidity : 휘발성 산도 citric acid : 시트르산 residual sugar : 잔류 설탕 chlorides : 염화물 free sulfur dioxide : 자유 이산화황 total sulfur dioxide : 총 이산화황 density : 밀도 pH : pH sulphates : 황산염 alcohol : 알코올 quality : 품질 # 종속변수 1. 의사결정트리 (파이썬) # 라이브러리 및 데이터 불러오기 import pandas as pd wine = pd.read_csv("C:/data/whitewines.csv") wine.info() # 종속변수 / 입력변수 나누기 x = wine.iloc[:,..

앙상블(Ensemble), 랜덤 포레스트(Random Forest)

앙상블 (Ensemble) 어려운 문제의 결론을 내기 위해 여러명의 전문가로 위원회를 구성해 다양한 의견을 수렴하고 결정하듯이 앙상블 학습의 목표는 다양한 분류기의 예측 결과를 결합함으로써 단일분류기보다 신뢰성이 높은 예측값을 얻는다. 문제를 해결하기위해 전문가들을 모으는것 voting : 서로 다른 알고리즘으로 결과를 낸뒤 다수결로 정하는것 bagging : 의사결정트리를 가지고 하되 트레인데이터의 표본을 뽑아낼때 중복으로 뽑아냄 하나의 알고리즘으로하되 데이터가 랜덤하게 뽑아냄(중복될 수 있음) 랜덤 포레스트(RandomForest) decesion tree와 bagging을 결합한 알고리즘 매실행시마다 랜덤하게 관측치와 변수를 선택하므로 실행결과가 조금씩 달라지게된다. (변수를 바꿔가면서 실행한다.)..

반응형