반응형

전체 글 232

사건과 확률

사건 관측치나 데이터가 특정 조건을 만족시키는 상황 로또 1등에 당첨될 사건 너구리에 다시마가 2개 나올 사건 한화 이글스가 KBO 1위할 사건 확률 경험 혹은 실험결과로 특정한 사건이나 결과가 발생할 가능성을 말한다. 관심있는 사건이 발생할 가능성을 0 ~ 1사이 숫자로 표현한 값 번개에 맞을 확률? 0.0002 확률의 종류 1. 한계확률, 주변확률 아무런 조건이 없는 상태에서 A라는 사건이 발생할 확률 행과 열의 합을 빈도 전체합으로 나누면 한계확률을 구할 수 있다. P(A) 예) 30일중 하루를 뽑았을때 맑은 날일 확률은? 15/30 맑음 흐림 비 눈 행의 합 한계확률 서울 8 3 5 2 18 18/30 천안 7 3 1 1 12 12/30 열의 합 15 6 6 3 30 한계확률 15/30 6/30 ..

강화학습 - 슈퍼마리오 DQN 기본 코드

기존에 가지고 있던 슈퍼마리오 강화학습 코드가 안돌아가서 해결법을 찾다가 발견한 것들 1. pytorch 설치 CPU 버전 !pip install torch==0.3.1 # 사용 X conda install pytorch-cpu torchvision-cpu -c pytorch # 사용 O !pip install torch 2. BinarySpaceToDiscreteSpaceEnv 대신 JoypadSpace를 임포트 해야한다. from nes_py.wrappers import BinarySpaceToDiscreteSpaceEnv # 사용 X from nes_py.wrappers import JoypadSpace # 사용 O 3. 슈퍼마리오 DQN 기본 코드 from nes_py.wrappers import..

혼동행렬 / 정확도 / 정밀도 / 재현율 / F1 점수

1. 혼동행렬 (confusion matrix) 모델의 성능을 평가할때 사용되는 지표 예측값이 실제 관측값을 얼마나 정확히 예측했는지 보여주는 행렬 예상(예) 예상(아니오) 실제(예) TP FN 실제(아니오) FP TN TP(True Positive) : 참긍정, 병에 관해 예 (병이 있을것이다.)라고 예측한 환자가 실제 병을 가진 경우 TN(True Negative) : 참부정, 병에 관해 아니오(병이 없을 것이다)라고 예측한 환자가 실제로 병이 없는 경우 FP(False Positive) : 거짓긍정, 병에 관해 예라고 예측한 환자가 실제로는 병이 없는 경우 FN(False Negative) : 거짓부정, 병에 관해 아니오라고 예측한 환자가 실제로는 병이 있는 경우 예 ) A 병원 (잘된 분류 / 잘..

유방암 데이터 분석하기

R로 분석하기 1단계 : 데이터 수집 유방암 데이터 http://archive.ics.uci.edu/ml/index.php UCI Machine Learning Repository Welcome to the UC Irvine Machine Learning Repository! We currently maintain 497 data sets as a service to the machine learning community. You may view all data sets through our searchable interface. For a general overview of the Repository, please visit ou archive.ics.uci.edu 위스콘신 대학의 연구원들의 자료 유방..

Object Detection API 설치 - Window 10 / CPU 버전

1. 아나콘다 설치 https://truman.tistory.com/60?category=840818 파이썬 - 아나콘다(Anaconda) 설치법 https://www.anaconda.com/distribution/ Anaconda Python/R Distribution - Free Download Anaconda Distribution is the world's most popular Python data science platform. Download the free version to ac.. truman.tistory.com 2. 아나콘다 가상환경 만들기 2-1 Anaconda Navigator 실행 2-2 왼쪽 메뉴의 'Environments' -> 아래의 'Create' 클릭 2-3 가상환경 ..

CNN(Convolution Neural Network)의 기본

1. CNN의 개요 https://truman.tistory.com/170 딥러닝의 종류와 개념 1. CNN Convolutional Neural Network, 합성곱 신경망 인간의 시신경 구조를 모방한 기술 1989년 LeCun이 발표한 논문에서 처음 소개가 되었으며, 필기체 zip code 인식을 위한 프로젝트를 통해 개발이 되었다... truman.tistory.com CNN은 합성곱(Convolution) 연산을 사용하는 ANN(Artificial Neural Network)의 한 종류이다. Convolution을 사용하면 3차원 데이터의 공간적 정보를 유지한 채 다음 레이어로 보낼 수 있다. 대표적인 CNN으로는 LeNet(1998)과 AlexNet(2012)이 있다. VGG, GoogLeNe..

데이터 분석 연습1 - 서울시 구별 CCTV 현황 분석

목표 어디에 CCTV가 많이 설치됐는지? 구별 인구 대비 비율 구별 인구 현황 구별 CCTV 현황 (시각화) 사용 데이터 1. 서울시 자치구 연도별 cctv 설치 현황 (.csv) 2. 서울시 인구 통계 (.xls) 1. pandas로 텍스트 파일과 엑셀 파일 읽기 # pandas 불러오기 import pandas as pd # CSV파일 읽어들이기 CCTV_Seoul = pd.read_csv("C:/datascience_train/data/01. CCTV_in_Seoul.csv", encoding='utf-8') CCTV_Seoul.head() # 컬럼 이름 변경하기 (기관명 -> 구별) # inplace=True : 실제 CCTV_Seoul의 내용을 변경 CCTV_Seoul.rename(columns..

머신러닝 - feature scaling

feature scaling 서로 다른 변수의 값 범위를 일정한 수준으로 맞추는 작업 비교해야할 데이터의 기준이 서로 다른 경우에 같은 기준으로 만들어서 비교한다. 방법 : 표준화(standardization), 정규화(Normalization) 값이 잘 안나오면 두개를 각각 해본다. 표준화 (standardization) 데이터의 평균이 0이고 표준편차가 1인 정규분포를 가진 값으로 변환한다. (x - 평균) / 표준편차 파이썬 : sklearn.preprocessing.StandardScaler 정규화 (Normalization) 서로 다른 피처의 크기를 통일하기 위해 크기를 변환해주는 작업 최소 0 ~ 최대 1의 값으로 변환한다. (x - min(x)) / (max(x) - min(x)) 파이썬 :..

머신러닝 - 머신러닝 개요 / kNN

머신러닝 개요 1. 머신러닝(Machin Learning) 인간의 학습 능력과 같은 기능을 컴퓨터가 하게 만드는 기술 인공지능(AI) 연구분야의 하나이다. 인공지능이란 인간이 원래 가지고 있는 지적 능력을 컴퓨터가 하게 만드는 기술 소프트웨어 분류(classification) : 주어진 데이터를 분류 예측 : 과거의 수치를 기반으로 미래의 수치 예측(회귀) 군집(ciustering) : 데이터를 비슷한 집합으로 분류 2. 지도학습(Supervised Learning) 레이블이 달려 있고 정해져 있는 데이터를 가지고 학습 이미지(개, 고양이), 스팸/햄 메일, 시험 성적 예측 regression : 예측 binary classification : 합격/불합격, 개/고양이, 암/양성 multi classif..

파이썬 - Numpy

Numpy 과학계산을 위한 라이브러리로 다차원 배열 처리하는데 필요한 기능을 제공한다. numpy 배열은 동일한 타입의 값을 갖는다. 1. 기본 사용법 1) numpy array 생성 # 1차원 배열 만들기 z1 = np.array([1,2,3]) # 2차원 배열 만들기 (2행3열) z2 = np.array([[1,2,3],[4,5,6]]) # 2차원 배열 만들기 (3행3열) lst = [[1,2,3],[4,5,6],[7,8,9]] z3 = np.array(lst) # bool타입의 배열 만들기 (3행3열) b = np.array([[False,True,False], [True,False,True], [False,True,False]]) 2) 연속되는 수 배열 생성 및 차원 바꾸기 # range로 배열 ..

컴퓨터/파이썬 2020.05.07
반응형