Patrick's 데이터 세상
R 언어와 문법 - 외부 데이터 불러오기 본문
외부 데이터 불러오기
① CSV 파일 불러오기
matrix 명령어의 첫 번째 인수는 행렬에 들어가는 데이터들을 묶어놓은 벡터가 할당되며 ncol 옵션으로 열(column)의 수를 정하거나
nrow 옵션으로 행(row)의 수를 정해 행렬의 크기를 사용자가 원하는 대로 지정할 수 있다.
header=T 옵션을 이용하면 csv 파일의 첛 줄을 변수명으로 지정할 수 있다.
또한 sep=',' 옵션을 통해 데이터가 쉼표로 구분된 데이터 파일(즉, scv파일)임을 지정해준다.
read.table 명령어를 이용할 때는 파일 경로에 \대신 \\를 사용함에 유의한다.
ex)
data1 <- read.table("D:\\DATA\\example.csv", header=T, sep",")
※ 유사한 명령어인 read.csv를 이용할 수도 있다.
사용법은 read.table과 비슷하지만 sep=','를 통해 구분자를 명시할 필요가 없다.
② txt 파일 불러오기
명령어 read.table을 이용하여 txt파일 역시 데이터 프레임의 형태로 불러올 수 있다.
이 경우 sep=',' 옵션을 사용하지 않으면 csv 파일이 아닌 일반 txt 파일을 불러올 수 있다.
txt 파일을 데이터셋의 형태로 불러올 때는 txt 파일이 구분자나 형식 등을 잘 지켜서 작성되어 있어야 한다.
ex)
data2 <- read.table("D:\\DATA\\example.txt")
③ 엑셀 파일(xls/xlsx) 불러오기
엑셀 파일을 불러오는 방법은 두 가지이다.
첫 번째 방법은 엑셀 파일을 엑셀로 실행 시킨 뒤 csv 파일 형식으로 저장하여 앞의 csv파일 불러오기 방법으로 불러오는 방법.
두 번째 방법으로 R에서 지원하는 패키지를 설치하여 엑셀 파일을 직접 불러오는 방법
ex)
library(RODBC) # 패키지 열기
new <- odbcConnectExcel("c:\\data\\mydata") # 엑셀 파일의 경로 입력
yourdata <- sqlFetch(new, "Sheet1") # 엑셀 파일의 워크시트(sheet) 이름 입력
close(new)
※ 엑셀 파일의 경로를 입력하는 경우 확장자를 생략하고 작성해야 하는 점에 유의.
엑셀 파일의 워크시트 이름은 대소문자를 구분.
'Programming > R' 카테고리의 다른 글
R 언어와 문법 - 사용자 정의 함수 (0) | 2020.06.25 |
---|---|
R 언어와 문법 - 반복 구문과 조건문 (0) | 2020.06.24 |
R 언어와 문법 - 데이터 핸들링 (0) | 2020.06.24 |
R 언어와 문법 - 기초 함수 (0) | 2020.06.24 |
R 언어와 문법 - 데이터 구조 (0) | 2020.06.24 |