본문 바로가기
Programming/R

[R] 히스토그램(histogram) 그리기

by 코딩하는 금융인 2023. 1. 8.

안녕하세요.

대표적인 시각화 도표인 히스토그램을 R로 표현하는 방법에 대해 알아보겠습니다.

 

 R 히스토그램(histogram) 그리기

▣ 히스토그램 (histogram)이란?

표로 되어 있는 도수 분포를 그래프로 나타낸 것

- 변수의 계급별 빈도수를 나타내기 위해 히스토그램을 이용함.

- R에서는 히스토그램을 그리기 위해 hist()나 ggplot() 등의 함수를 사용함.

 

▣ 예시 데이터 : 국내주식(KOSPI, KOSDAQ) 시가총액 리스트

▶ 사이트 - Seibro 증권정보포털 > 국내주식 시가총액 리스트

출처 = 증권정보포털

■ 패키지 및 데이터 다운로드
# installing and loading readxl package 
install.packages("dplyr")
install.packages("ggplot2")
library(dplyr)
library(ggplot2)

# data to dataframe
kospi_caps <- read.csv("kospi_marketcaps.csv")
kosdaq_caps <- read.csv("kosdaq_marketcaps.csv")

# 데이터 요약보기
glimpse(kospi_caps)​

- dplyr 패키지의 glimpse 함수를 사용하면 데이터의 특성과 개략적인 내용을 확인할 수 있다.

■ 히스토그램 그리기
# hist(), breaks 옵션으로 히스토그램 구간 쪼개기 가능
hist(kospi_caps$시가총액.억., breaks = 15, ylim = c(0, 100))
hist(kosdaq_caps$시가총액.억., breaks = 15, ylim = c(0,100))​

# mtcars로 ggplot() 히스토그램 그리기
ggplot(mtcars, aes(x=mpg)) + 
  geom_histogram(binwidth = 3, colour = "black", fill = "white") +
  # 초록 평균 점선 추가하기
  geom_vline(aes(xintercept = mean(mpg, na.rm = T)),
             colour = "green", linetype = "dashed", size = 1)
반응형

댓글