본문 바로가기
728x90

Programming/R13

R 연습 사이트 추천 (공부, 예제) 안녕하세요. 오늘은 가장 유명한 통계프로그램 중 하나인 R을 공부하고 연습하는 데 유용한 사이트들을 소개해드리겠습니다. R이란? 통계 컴퓨팅 및 그래픽을 위한 무료 소프트웨어 환경으로 다양한 UNIX 플랫폼, Windows 및 MacOS에서 컴파일 및 실행됨. 통합 개발 환경(IDE)을 필요로 하는 경우, Rstudio를 설치하여 사용하면 됨. - 공식 R 설치 사이트 : https://ftp.harukasan.org/CRAN/ - 공식 Rstudio 설치 사이트 : https://www.rstudio.com/ R 공부 및 연습 사이트 1. pluralsight 사이트 : https://www.pluralsight.com/search?q=R Codeschool try R이 전신으로 무료로 강의들(영어)이.. 2022. 6. 10.
[R] 데이터 전처리 - dplyr 패키지 안녕하세요. Rstudio 데이터 전처리 및 가공에 필수적인 패키지 dplyr에 대해서 알아보겠습니다. dplyr 패키지 개요 ▣ dplyr 패키지란? R tidyverse의 핵심 패키지 중 하나이며 데이터 프레임 조작에 특화된 함수 세트 ※ tidyverse: ggplot2, dplyr, tidyr, readr, purrr, tibble, stringr, forcats 등 데이터 모델링, 변환, 시각화 등 제공 ▣ dplyr 패키지 주요 함수 함수 기능 filter() 행(row) 추출 select() 변수(열, column) 추출 arrange() 정렬 mutate() 변수 추가 summarise() 통계치 산출 group_by() 집단별로 나누기 left_join() 데이터 합치기 (열 기준) bi.. 2022. 4. 24.
[R] 반응형 그래프 만들기 plotly, dygraphs R 데이터 분석 관련하여 책을 보다가 시각화에 대한 흥미로운 내용이 있어 공유합니다. 보통 R에서 시각화를 할 때는 'ggplot2' 패키지를 주로 사용하는데 오늘은 기존의 시각화 그래프와는 다른 반응형 그래프 패키지 'plotly'와 'dygraphs'에 대해 소개해드리겠습니다. 반응형 그래프 (interactive graph)란? - 마우스 움직임에 따라 반응하며 실시간 형태가 변하거나 세부 정보를 보여주는 그래프 반응형 그래프 만들기 Sample data : gapminder (국가별 경제 수준과 평균 수명 동향) # R query # 패키지 다운로드 install.packages('plotly') library(plotly) library(ggplot2) library(dplyr) # 데이터 다운.. 2021. 6. 29.
[R] 통계 분석 및 가설 검정 (t 검정, 상관분석) 목차 통계 기법 통계적 가설 검정 T 검정 상관분석 References 통계 기법 데이터를 다루는 목적에 따라 크게 두 가지로 분류 1. 기술 통계 데이터를 요약하거나 묘사, 설명하는 통계 기법 ( "기술" : 사물의 내용을 기록하여 서술하는 것 ) 또한, 기술 통계는 2가지로 설명될 수 있음 ㄱ. 집중화 경향 (중심경향성) 대표 통계량 : 평균, 중앙값, 최빈값 중심경향성은 표본 데이터의 중심적인 경향성을 정확하게 설명할 수 있는 우수한 기술통계. 하지만, 데이터의 퍼져 있음, 즉 산포 정도까지는 설명하지 못하는 단점을 가지고 있음. ㄴ. 분산 경향 대표 통계량 : 분산, 표준편차, 사분위, 범위 데이터의 전반적인 흩어짐과 변화량에 대한 정확한 정보를 제공해줌. 데이터의 분포가 얼마나 솟아 있고, 또한.. 2021. 6. 27.
[ R ] 그룹별 누적 합계 구하기 # R을 활용하여 그룹별 누적 합계 구하기 *본 문제는 모 기업 데이터 분석 시험에서 나온 문제를 제 방식대로 변형한 문제입니다. 데이터 설명 [ MEMBER_ORDER ] member_no : 회원번호 group : 그룹명(A/B/C) order_code : 주문번호 order_date : 주문일자 order_pay : 주문금액 * 위의 예시는 필자가 임의의 값으로 넣은 데이터 테이블입니다. 문제. MEMBER_ORDER 테이블에서 각 그룹(group)의 일자별 누적 고객수(cum_buyer_cnt)를 구하는 코드를 작성하라. 이때 2020-07-XX의 누적 고객수란 2020년 7월 1일부터 2020년 7월 xx일까지 기간 동안 한 번 이상 주문한 회원의 수이며, 누적 고객수의 정의에 따라 이미 한 번.. 2021. 4. 6.
[ R ] 코딩테스트 예제 날짜별 누적합 구하기 # R을 활용하여 2개의 데이터 테이블을 병합하고 날짜별 누적합 구하기 *본 문제는 모 기업 코딩테스트 시험에서 나온 문제를 제 방식대로 변형한 문제입니다. 데이터 설명 MEMBER_GROUP : 회원들의 마지막 주문일 데이터 member_no : 회원 아이디 번호 group : A/B/C A : 마지막 주문일이 2020.06 회원 B : 마지막 주문일이 2020. 06 이전 회원 C : 주문 이력이 없는 회원 ORDER : 회원들의 마지막 주문일 데이터 order_code : 주문번호 order_time : 주문시간 order_pay : 주문금액 member_no : 회원번호 문제1. MEMBER_GROUP과 ORDER를 member_no 컬럼을 key로 병합하여 MEMBER_ORDER 객체를 생성하시.. 2021. 3. 31.
728x90