본문 바로가기
728x90

Programming/R13

[R] 정규표현식 함수 및 예시 안녕하세요. 오늘은 R로 정규표현식을 표현하는 함수들에 대해 정리해보는 시간을 가져보겠습니다. R 정규표현식 함수 및 예제 ▣ 정규표현식 함수 정리 in R str_detect(): 이 함수는 확인하는 데 사용됩니다. 문자열에 패턴이 있는 경우. 패턴이 발견되었는지 여부를 나타내는 논리 값(TRUE 또는 FALSE)을 반환합니다. str_subset(): 이 함수는 추출하는 데 사용됩니다. 문자열에서 일치하는 패턴. 일치하는 패턴을 문자열로 반환합니다. str_extract(): 이 함수는 문자열에서 패턴의 첫 번째 일치를 추출하는 데 사용됩니다. 첫 번째로 일치하는 패턴을 문자열로 반환합니다. str_extract_all(): 이 함수는 문자열에서 패턴의 모든 일치 항목을 추출하는 데 사용됩니다. 일치.. 2023. 3. 1.
[R] 파이 차트 (Pie Chart) 안녕하세요. 오늘은 R로 파이 차트를 시각화내는 방법에 대해 알아보겠습니다. R 파이 차트 설명 및 예시 ▣ 파이 차트란? (Pie Chart) 범주별 구성 비율을 원형으로 표현한 그래프 - 범주의 개수가 적을 때 전체 대비 여러 구성 요소 간 관계를 표시하는 데 유용함. : 예시 데이터 (삼성전자 최대주주등 지분현황) 참조 사이트 - CompanyGuide 삼성전자 종목정보 - 삼성전자 최대주주등에 대한 주주 구분 현황을 파이 차트로 표현해보겠습니다. ■ 최대주주 등 상세내용 주주명 관계 보통주 지분율 최종변동일 삼성생명보험 본인 508,157,148 8.51 2018/05/31 삼성물산 특수관계인 298,818,100 5.01 2018/05/04 홍라희 특수관계인 117,302,806 1.96 202.. 2023. 1. 23.
[R] 버블 차트 (Bubble Chart) 안녕하세요. 오늘은 R로 산점도의 한 종류인 버블 차트를 시각화내는 방법에 대해 알아보겠습니다. R 버블 차트 설명 및 예시 ▣ 버블 차트란? (Bubble Chart) 관측자에게 더 풍부한 정보를 제공하기 위해 데이터의 3차원 표시가 필요할 때 사용되는 관계형 차트 - 산점도의 한 종류로, 3개의 축(일반적으로 x, y, z)에 걸쳐 데이터를 처리하고 나타내는 다른 3차원 차트와 달리 2개의 축(x, y)에 표시되며 버블 크기는 세 번째 중요한 정보를 전달함. ▣ 국내 시가총액 상위 30 기업의 재무안정성 비교 : 예시 데이터 - 시가총액 30 재무안정성 비율 ■ R 버블차트 코드 및 결과 # installing and loading readxl package library(dplyr) # data t.. 2023. 1. 14.
[R] 워드 클라우드(WordCloud) 설명 및 예시 안녕하세요. 오늘은 R로 시각화 방법 중 하나인 워드 클라우드에 대해 예시와 함께 알아보겠습니다. R 워드 클라우드 설명 및 예시 ▣ 워드 클라우드란? (WordCloud) 데이터에서 얻어진 단어들을 분석하여 중요도나 인기도 등을 고려하여 시각적으로 늘어놓은 것 ▣ wordcloud() 함수 내용 1. words : 단어 벡터 2. freq : 빈도 벡터 3. min.freq: 최소 빈도 설정값 4. scale : 최다빈출단어부터 최소빈출단어까지의 크기 차이에 대한 설정. 5. colors : 빈도에 따른 색상의 지정 6. random.orders : 단어의 위치에 대한 파라미터. FALSE일 경우, 최다빈출단어가 가운데에 온다. 7. rot.per : 90도 회전해서 보여줄 단어의 비율 : 예시 데이터.. 2023. 1. 11.
[R] 히스토그램(histogram) 그리기 안녕하세요. 대표적인 시각화 도표인 히스토그램을 R로 표현하는 방법에 대해 알아보겠습니다. R 히스토그램(histogram) 그리기 ▣ 히스토그램 (histogram)이란? 표로 되어 있는 도수 분포를 그래프로 나타낸 것 - 변수의 계급별 빈도수를 나타내기 위해 히스토그램을 이용함. - R에서는 히스토그램을 그리기 위해 hist()나 ggplot() 등의 함수를 사용함. ▣ 예시 데이터 : 국내주식(KOSPI, KOSDAQ) 시가총액 리스트 ▶ 사이트 - Seibro 증권정보포털 > 국내주식 시가총액 리스트 ■ 패키지 및 데이터 다운로드 # installing and loading readxl package install.packages("dplyr") install.packages("ggplot2") .. 2023. 1. 8.
[R] 데이터 전처리, 결측치 안녕하세요. 오늘은 데이터 전처리에서 가장 중요한 과정 중 하나인 결측치에 대해 알아보고 R을 활용하여 처리하는 방법에 대해 알아보겠습니다. 결측치 개요 (정의/종류/방법) ▣ 결측치란? 자료가 누락되어있는 상태를 결측(missing)이라고 하며 누락 되어있는 상태를 별도의 숫자 또는 문자로 표기한 것을 결측값(missing value)이라고 한다. ▣ 결측치 종류 완전 무작위 결측 (MCAR; Missing Completely at Random) : 결측치가 다른 변수들과 아무런 상관이 없음 무작위 결측 (MAR; Missing at Random) : 특정 변수에 관련되어 누락되었지만, 그 변수는 결과와 관련이 없음 비무작위 결측 (MNAR; Missing Not At Random) : 결과에 관련이 .. 2022. 8. 7.
728x90