
1. 하둡에서 사용하는 스토리지 포맷 작업 (처음에 한번만 하는거임)
| hdfs namenode -format | 

1번 작업을 두 번하면 엉켜버림
| cd | 
| ll | 

위의 data(빨간색 표시) 디렉토리는 포맷을 했기 때문에 생성됨
만약 포맷작업을 다시 하고 싶으면 저 data 디렉토리를 없애고 포맷작업을 해야함
2. 하둡에서 사용하는 프로세서 실행
| start-dfs.sh | 
| yes | 
| start-yarn.sh | 
| mr-jobhistory-daemon.sh start historyserver | 
| yarn-daemon.sh start proxyserver | 

3. 하둡에서 사용하는 프로세서 확인
| jps | 
프로세서 아이디(숫자)는 개인마다 다르다.
프로세서 이름은 아래에 것들은 꼭 있어야한다. (순서 상관없음)
- ResourceManager
- DataNode
- NameNode
- SecondaryNameNode
- NodeManager

4. 데몬 종료 (지금은 하지 않기)
| stop-yarn.sh | 
| stop-dfs.sh | 
| mr-jobhistory-daemon.sh stop historyserver | 

5. 하둡의 파일 시스템 확인
| hdfs dfs -ls / | 
실제로는 data 디렉토리 안에 들어가 있음

6. 디렉토리 생성 및 확인
서브디렉토리를 한번에 만들지 못하므로 하나하나 만들어야함
| hdfs dfs -mkdir /user | 
| hdfs dfs -mkdir /user/hadoop | 
| hdfs dfs -mkdir /user/hadoop/conf | 
| hdfs dfs -ls -R / | 

7. 워드클라우드 띄우고 저장
1) 텍스트 파일 복사 및 확인
| cp /media/sf_linux/frozen.txt /home/hadoop | 
| ll | 

2) 로컬파일시스템의 파일을 HDFS에 복사 및 확인
| hdfs dfs -put frozen.txt conf/ | 
| hdfs dfs -ls conf/ | 
hdfs dfs -put <파일이름> <복사할위치>

3) 워드클라우드 띄우고 파일 확인
| cd /home/hadoop/hadoop-2.7.2/share/hadoop/mapreduce | 
| yarn jar hadoop-mapreduce-examples-2.7.2.jar wordcount conf/frozen.txt frozen_wc | 
| hdfs dfs -ls frozen_wc | 


8. HDFS에 저장된 파일을 로컬파일시스템으로 복사
| hdfs dfs -get frozen_wc/part-r-00000 /home/hadoop/frozen_wc | 

9. 복사한 파일(워드클라우드) 내용 보기
| cd | 
| llvi frozen_wc | 
| ESC키 누르기 -> :q! 눌러서 나가기 | 

기타 사용법
1. 지정된 디렉토리, 파일 용량 (byte)
| hdfs dfs -du | 
| hdfs dfs -du output | 
2. 전체 합계 용량
| hdfs dfs -du -s | 
3. 파일 내용 보기
| hdfs dfs -cat output/part-r-00000 | 
| hdfs dfs -text output/part-r-00000 | 
| hdfs dfs -cat conf_backup/frozen.txt | tail -5 | 
| hdfs dfs -text conf_backup/frozen.txt | tail -5 | 
4. 지정한 디렉토리, 파일을 복사
| hdfs dfs -cp conf conf_backup | 
| hdfs dfs -ls conf_backup | 
5. 지정한 디렉토리, 파일을 이동
| hdfs dfs -mv conf_backup conf2 | 
| hdfs dfs -ls conf2 | 
| hdfs dfs -ls -R | 
6. 지정한 디렉토리, 파일 삭제
| hdfs dfs -rm conf2/frozen.txt | 
| hdfs dfs -ls conf2 | 
반응형
    
    
    
  '컴퓨터 > 기타' 카테고리의 다른 글
| 리눅스(우분투) 기본 명령어 모음 (0) | 2020.07.27 | 
|---|---|
| 하둡(hadoop) - 하이브(Hive) 설치 (0) | 2020.06.14 | 
| 리눅스(Linux) - 하둡(Hadoop) 설치 및 환경 설정 (0) | 2020.06.14 | 
| 리눅스(Linux) - 접속 계정 변경 / 네트워크 설정 / 마우스 통합 설정 (0) | 2020.06.13 | 
| Virtual Box로 리눅스(Linux) 설치 / CentOS 설치 (0) | 2020.06.13 |