강화학습 2

강화학습 - 슈퍼마리오 DQN 기본 코드

기존에 가지고 있던 슈퍼마리오 강화학습 코드가 안돌아가서 해결법을 찾다가 발견한 것들 1. pytorch 설치 CPU 버전 !pip install torch==0.3.1 # 사용 X conda install pytorch-cpu torchvision-cpu -c pytorch # 사용 O !pip install torch 2. BinarySpaceToDiscreteSpaceEnv 대신 JoypadSpace를 임포트 해야한다. from nes_py.wrappers import BinarySpaceToDiscreteSpaceEnv # 사용 X from nes_py.wrappers import JoypadSpace # 사용 O 3. 슈퍼마리오 DQN 기본 코드 from nes_py.wrappers import..

딥러닝의 종류와 개념

1. CNN Convolutional Neural Network, 합성곱 신경망 인간의 시신경 구조를 모방한 기술 1989년 LeCun이 발표한 논문에서 처음 소개가 되었으며, 필기체 zip code 인식을 위한 프로젝트를 통해 개발이 되었다. 2012년 Image Net 대회에서 기존의 모든 알고리즘을 압도하는 성능으로 1등을 차지함. 이미지를 인식하기위해 패턴을 찾는데 특히 유용하다. 데이터를 직접 학습하고 패턴을 사용해 이미지를 분류한다. 자율주행자동차, 얼굴인식과 같은 객체인식이나 computer vision이 필요한 분야에 많이 사용되고 있다. 이미지의 공간정보를 유지한채 학습을 하게하는 모델 2. RNN Recurrent Neural Network, 순환신경망 순차적 정보가 담긴 데이터에서 규..

반응형