Patrick's 데이터 세상

기초 통계 분석 본문

Programming/R

기초 통계 분석

patrick610 2020. 6. 25. 00:21
반응형
SMALL

기술 통계

 

data(iris)
head(iris)

   #Result


  ※ data는 내장된 데이터 프레임을 워크스페이스 안에 로드하여 쓸 수 있게 해주는 함수이다.
      데이터 프레임은 R에서 행렬 형태의 자료를 담아두는 자료의 구조이다.
      head는 데이터를 기본 6줄을 보여주어 데이터가 성공적으로 import 되었는지를 살펴볼 수 있는 함수이다.
      특정 라인까지 보고 싶다면 head(iris, n)을 사용하여 n에 숫자를 지정해주면 된다.

 

 

summary(iris)

   #Result

 

※ summary는 데이터의 컬럼에 대한 전반적인 기초 통계량을 보여준다.
      아래의 예를 보면 summary는 iris 데이터 프레임의 각 컬럼에 대하여 최소값(min), 최대값(max), 25% 백분위수(1st Qu), 75% 백분위수(3rd Qu.), 중앙값(median) 그리고 평균(mean)을 구해준다.

 

 

mean(iris$Sepal.Length)   # 평균

   # Result

median(iris$Sepal.Length)   # 중앙값

   # Result

sd(iris$Sepal.Length)   # 표준편차

   #Result

 

var(iris$Sepal.Length)   # 분산

   #Result

quantile(iris$Sepal.Length, 1/4)   # 1사분위수

   #Result

quantile(iris$Sepal.Length, 3/4)   # 3사분위수

   #Result

max(iris$Sepal.Length)   # 최대값

   #Result

min(iris$Sepal.Length)   # 최소값

   #Result

 

※ 특정 컬럼의 통계량 구하기.
    데이터의 특정 컬럼을 선택할 때에는 "데이터네임$column명"으로 써준다.

 

 

 

반응형
LIST

'Programming > R' 카테고리의 다른 글

다변량 분석  (0) 2020.06.25
회귀 분석  (0) 2020.06.25
통계학 개론  (0) 2020.06.25
결측값 처리, 이상값 검색  (0) 2020.06.25
데이터 마트 - 데이터 테이블  (0) 2020.06.25
Comments