본문 바로가기
Programming/R

[R] 워드 클라우드(WordCloud) 설명 및 예시

by 코딩하는 금융인 2023. 1. 11.

안녕하세요.

오늘은 R로 시각화 방법 중 하나인 워드 클라우드에 대해 예시와 함께 알아보겠습니다.

 

 R 워드 클라우드 설명 및 예시

▣ 워드 클라우드란? (WordCloud)

데이터에서 얻어진 단어들을 분석하여 중요도나 인기도 등을 고려하여 시각적으로 늘어놓은 것

 

▣ wordcloud() 함수 내용

1. words : 단어 벡터

2. freq : 빈도 벡터

3. min.freq: 최소 빈도 설정값

4. scale : 최다빈출단어부터 최소빈출단어까지의 크기 차이에 대한 설정.

5. colors : 빈도에 따른 색상의 지정

6. random.orders : 단어의 위치에 대한 파라미터. FALSE일 경우, 최다빈출단어가 가운데에 온다.

7. rot.per : 90도 회전해서 보여줄 단어의 비율

 

: 예시 데이터 거래대금 상위 50 리스트 (2023-01-10)

사이트 바로가기

출처= 한국거래소 거래 상위

- 원래 워드 클라우드는 단어의 빈도에 따라 색과 크기를 달리하여 시각화하는 방법이지만, 색다르게 당일 종목의 거래대금 크기에 따라 다르게 보여주는 방법으로 활용해보겠습니다.

▣ R 코드부터 결과 출력까지
# installing and loading readxl package 
install.packages("wordcloud")
library(wordcloud)
library(dplyr)
library(RColorBrewer) # 글자 색깔 표현

# data to dataframe
kstock_accounts <- read.csv("거래대금 상위 50 (2023-01-10).csv")

# 데이터 요약보기
glimpse(kstock_accounts)

# wordcloud 생성
color <- brewer.pal(8, "Accent") # 색상개수 조합이름
png(filename = "wordcloud.png", width = 500, height = 400) # 파일 저장하기

wordcloud(words = kstock_accounts$종목명,
          freq = kstock_accounts$거래대금,
          min.freq = 1,
          random.order = F, # 빈도 많은 단어 중앙 위치
          rot.per = .1,
          scale = c(5,0.3), # 최대빈도, 최소빈도 크기 설정
          colors = color)

dev.off() # 저장 완료​

R WordCloud 결과

 

 

 

 

반응형

'Programming > R' 카테고리의 다른 글

[R] 파이 차트 (Pie Chart)  (0) 2023.01.23
[R] 버블 차트 (Bubble Chart)  (0) 2023.01.14
[R] 히스토그램(histogram) 그리기  (2) 2023.01.08
[R] 데이터 전처리, 결측치  (0) 2022.08.07
R 연습 사이트 추천 (공부, 예제)  (0) 2022.06.10

댓글