안녕하세요.
대표적인 시각화 도표인 히스토그램을 R로 표현하는 방법에 대해 알아보겠습니다.
R 히스토그램(histogram) 그리기
▣ 히스토그램 (histogram)이란?
표로 되어 있는 도수 분포를 그래프로 나타낸 것
- 변수의 계급별 빈도수를 나타내기 위해 히스토그램을 이용함.
- R에서는 히스토그램을 그리기 위해 hist()나 ggplot() 등의 함수를 사용함.
▣ 예시 데이터 : 국내주식(KOSPI, KOSDAQ) 시가총액 리스트
▶ 사이트 - Seibro 증권정보포털 > 국내주식 시가총액 리스트
■ 패키지 및 데이터 다운로드
# installing and loading readxl package install.packages("dplyr") install.packages("ggplot2") library(dplyr) library(ggplot2) # data to dataframe kospi_caps <- read.csv("kospi_marketcaps.csv") kosdaq_caps <- read.csv("kosdaq_marketcaps.csv") # 데이터 요약보기 glimpse(kospi_caps)
- dplyr 패키지의 glimpse 함수를 사용하면 데이터의 특성과 개략적인 내용을 확인할 수 있다.
■ 히스토그램 그리기
# hist(), breaks 옵션으로 히스토그램 구간 쪼개기 가능 hist(kospi_caps$시가총액.억., breaks = 15, ylim = c(0, 100)) hist(kosdaq_caps$시가총액.억., breaks = 15, ylim = c(0,100))
# mtcars로 ggplot() 히스토그램 그리기 ggplot(mtcars, aes(x=mpg)) + geom_histogram(binwidth = 3, colour = "black", fill = "white") + # 초록 평균 점선 추가하기 geom_vline(aes(xintercept = mean(mpg, na.rm = T)), colour = "green", linetype = "dashed", size = 1)
반응형
'Programming > R' 카테고리의 다른 글
[R] 버블 차트 (Bubble Chart) (0) | 2023.01.14 |
---|---|
[R] 워드 클라우드(WordCloud) 설명 및 예시 (0) | 2023.01.11 |
[R] 데이터 전처리, 결측치 (0) | 2022.08.07 |
R 연습 사이트 추천 (공부, 예제) (0) | 2022.06.10 |
[R] 데이터 전처리 - dplyr 패키지 (0) | 2022.04.24 |
댓글