컴퓨터/R

R - 시각화 ② scatter plot, histogram

해피밀세트 2020. 4. 21. 19:42

 

 

 

들어가기 전에...

# R에서 제공하는 기본 데이터 확인

data()

# R에서 제공한 women 데이터 확인

women

 


 

1. 삼전도(scatter plot)

  • 주어진 데이터를 점으로 표시해 흩뿌리듯이 시각화한 그래프
  • 데이터의 실제값들이 표시 되므로 데이터의 분포를 한눈에 살펴보는데 유용하다.
  • x-y plotting

type

p :

l  :

b : ,

o : 점위의

h : 수직선

s : 계단형

n : 나타나지 않음

lty : 선의 유형 (1~6)

0 : 그리지 않음

1 : 실선(기본값)

2 : 대시

3 : 

4 : 점과 대시

5 :  대시

6 :  개의 대시

lwd : 선의 굵기
pch : 점의 종류
cex : 점의 크기

 

# 기본 사용법

plot(women)

# 컬럼을 지정해서 출력

plot(women$height)

# 여러가지 옵션 사용해보기

plot(x=women$height, y=women$weight,
     xlab="키",ylab="몸무게",
     main="미국 여성 70년대 기준",
     type='p', lty=4, lwd=2, pch=23)

# 자동으로 축 표시

plot(women$weight,  
      type='o', lwd=1, 
      xlab="", ylab="",col='violet', 
      ylim=c(110,170),axes=T)

 

# 축 직접 표시하기

plot(women$weight,  
     type='o', lwd=1, 
     xlab="", ylab="",col='violet', 
     ylim=c(110,170),axes=F)


axis(1,las=2, at=1:15,labels=women$weight)
axis(2,las=1)

# 축의 라벨을 직접 써주려면 x축,y축을 지정해서 그리면 안된다.

plot(x=women$height, y=women$weight,   
     type='o', lwd=1,  
     xlab="", ylab="",col='violet',  
     ylim=c(110,170),axes=F)

axis(1,las=2, at=1:15,labels=women$weight
axis(2,las=1)

 

# 다른 그래프 겹쳐서 그리기

disease <- read.csv("C:/data/1군전염병발병현황_년도별.csv",header=T,

              stringsAsFactors=F)

plot(disease$콜레라, type='o', lwd=1,

     xlab="", ylab="",col='violet',

     ylim=c(0,6000),axes=F)

axis(1,at=1:11,labels=disease$년도별,

     las=2)

axis(2,las=1)

lines(disease$장티푸스,col="blue",type="o")

lines(disease$이질,col="red",type="o")

lines(disease$대장균,col="black",type="o")

lines(disease$A형간염,col="orange",type="o")

# 눈금선 추가
abline(h=seq(0,6000,100),v=seq(1,11,1),
       lty=3, lwd=0.2)

# 범례 추가
legend(x=1, y=6000, legend=names(disease[2:6]),
       cex=0.8, lty=1, lwd=2, bg="white",
       col=c("violet","blue","red","black","orange"))

 


 

2. 히스토그램(histogram)

  • 자동으로 빈도수가 체크된다.

# 기본 사용법

x <- c(10,20,30,50,17,25,36,
       40,42,21,15,30,45,30,12)


hist(x,breaks=seq(5,55,10),right=F,
     col=rainbow(5),labels=T)

 

반응형

'컴퓨터 > R' 카테고리의 다른 글

R - 시각화 ③ box plot, Stem and Leaf Diagram  (0) 2020.04.22
R - cut  (0) 2020.04.21
R - 시각화 ① pie chart, bar graph  (0) 2020.04.20
R - 분할표 만들기  (0) 2020.04.20
R - grep과 정규표현식  (0) 2020.04.17