Patrick's 데이터 세상
기초 통계 분석 본문
반응형
SMALL
기술 통계
data(iris)
head(iris)
#Result
※ data는 내장된 데이터 프레임을 워크스페이스 안에 로드하여 쓸 수 있게 해주는 함수이다.
데이터 프레임은 R에서 행렬 형태의 자료를 담아두는 자료의 구조이다.
head는 데이터를 기본 6줄을 보여주어 데이터가 성공적으로 import 되었는지를 살펴볼 수 있는 함수이다.
특정 라인까지 보고 싶다면 head(iris, n)을 사용하여 n에 숫자를 지정해주면 된다.
summary(iris)
#Result
※ summary는 데이터의 컬럼에 대한 전반적인 기초 통계량을 보여준다.
아래의 예를 보면 summary는 iris 데이터 프레임의 각 컬럼에 대하여 최소값(min), 최대값(max), 25% 백분위수(1st Qu), 75% 백분위수(3rd Qu.), 중앙값(median) 그리고 평균(mean)을 구해준다.
mean(iris$Sepal.Length) # 평균
# Result
median(iris$Sepal.Length) # 중앙값
# Result
sd(iris$Sepal.Length) # 표준편차
#Result
var(iris$Sepal.Length) # 분산
#Result
quantile(iris$Sepal.Length, 1/4) # 1사분위수
#Result
quantile(iris$Sepal.Length, 3/4) # 3사분위수
#Result
max(iris$Sepal.Length) # 최대값
#Result
min(iris$Sepal.Length) # 최소값
#Result
※ 특정 컬럼의 통계량 구하기.
데이터의 특정 컬럼을 선택할 때에는 "데이터네임$column명"으로 써준다.
반응형
LIST
'Programming > R' 카테고리의 다른 글
다변량 분석 (0) | 2020.06.25 |
---|---|
회귀 분석 (0) | 2020.06.25 |
통계학 개론 (0) | 2020.06.25 |
결측값 처리, 이상값 검색 (0) | 2020.06.25 |
데이터 마트 - 데이터 테이블 (0) | 2020.06.25 |
Comments