[R] 데이터 전처리 - dplyr 패키지
안녕하세요. Rstudio 데이터 전처리 및 가공에 필수적인 패키지 dplyr에 대해서 알아보겠습니다. dplyr 패키지 개요 ▣ dplyr 패키지란? R tidyverse의 핵심 패키지 중 하나이며 데이터 프레임 조작에 특화된 함수 세트 ※ tidyverse: ggplot2, dplyr, tidyr, readr, purrr, tibble, stringr, forcats 등 데이터 모델링, 변환, 시각화 등 제공 ▣ dplyr 패키지 주요 함수 함수 기능 filter() 행(row) 추출 select() 변수(열, column) 추출 arrange() 정렬 mutate() 변수 추가 summarise() 통계치 산출 group_by() 집단별로 나누기 left_join() 데이터 합치기 (열 기준) bi..
2022. 4. 24.
[R] 통계 분석 및 가설 검정 (t 검정, 상관분석)
목차 통계 기법 통계적 가설 검정 T 검정 상관분석 References 통계 기법 데이터를 다루는 목적에 따라 크게 두 가지로 분류 1. 기술 통계 데이터를 요약하거나 묘사, 설명하는 통계 기법 ( "기술" : 사물의 내용을 기록하여 서술하는 것 ) 또한, 기술 통계는 2가지로 설명될 수 있음 ㄱ. 집중화 경향 (중심경향성) 대표 통계량 : 평균, 중앙값, 최빈값 중심경향성은 표본 데이터의 중심적인 경향성을 정확하게 설명할 수 있는 우수한 기술통계. 하지만, 데이터의 퍼져 있음, 즉 산포 정도까지는 설명하지 못하는 단점을 가지고 있음. ㄴ. 분산 경향 대표 통계량 : 분산, 표준편차, 사분위, 범위 데이터의 전반적인 흩어짐과 변화량에 대한 정확한 정보를 제공해줌. 데이터의 분포가 얼마나 솟아 있고, 또한..
2021. 6. 27.