안녕하세요.
오늘은 R로 시각화 방법 중 하나인 워드 클라우드에 대해 예시와 함께 알아보겠습니다.
R 워드 클라우드 설명 및 예시
▣ 워드 클라우드란? (WordCloud)
데이터에서 얻어진 단어들을 분석하여 중요도나 인기도 등을 고려하여 시각적으로 늘어놓은 것
▣ wordcloud() 함수 내용
1. words : 단어 벡터
2. freq : 빈도 벡터
3. min.freq: 최소 빈도 설정값
4. scale : 최다빈출단어부터 최소빈출단어까지의 크기 차이에 대한 설정.
5. colors : 빈도에 따른 색상의 지정
6. random.orders : 단어의 위치에 대한 파라미터. FALSE일 경우, 최다빈출단어가 가운데에 온다.
7. rot.per : 90도 회전해서 보여줄 단어의 비율
: 예시 데이터 거래대금 상위 50 리스트 (2023-01-10)
⊙ 사이트 바로가기
- 원래 워드 클라우드는 단어의 빈도에 따라 색과 크기를 달리하여 시각화하는 방법이지만, 색다르게 당일 종목의 거래대금 크기에 따라 다르게 보여주는 방법으로 활용해보겠습니다.
▣ R 코드부터 결과 출력까지
# installing and loading readxl package install.packages("wordcloud") library(wordcloud) library(dplyr) library(RColorBrewer) # 글자 색깔 표현 # data to dataframe kstock_accounts <- read.csv("거래대금 상위 50 (2023-01-10).csv") # 데이터 요약보기 glimpse(kstock_accounts) # wordcloud 생성 color <- brewer.pal(8, "Accent") # 색상개수 조합이름 png(filename = "wordcloud.png", width = 500, height = 400) # 파일 저장하기 wordcloud(words = kstock_accounts$종목명, freq = kstock_accounts$거래대금, min.freq = 1, random.order = F, # 빈도 많은 단어 중앙 위치 rot.per = .1, scale = c(5,0.3), # 최대빈도, 최소빈도 크기 설정 colors = color) dev.off() # 저장 완료
반응형
'Programming > R' 카테고리의 다른 글
[R] 파이 차트 (Pie Chart) (0) | 2023.01.23 |
---|---|
[R] 버블 차트 (Bubble Chart) (0) | 2023.01.14 |
[R] 히스토그램(histogram) 그리기 (2) | 2023.01.08 |
[R] 데이터 전처리, 결측치 (0) | 2022.08.07 |
R 연습 사이트 추천 (공부, 예제) (0) | 2022.06.10 |
댓글