Patrick's 데이터 세상
R 언어와 문법 - 유용한 기능들 본문
반응형
SMALL
기타 유용한 기능들
① paste
입력받은 문자열들을 하나로 붙여준다.
'sep=' 옵션을 통해 붙이고자 하는 문자열들 사이에 구분자를 삽입시킬 수 있다.
ex)
number=1:10
alphabet=c("a", "b", "c")
paste(number, alphabet)
#Result
"1 a" "2 b" "3 c" "4 a" "5 b" "6 c" "7 a" "8 b" "9 c" "10 a"
paste(number, alphabet, sep=" to the ")
#Result
"1 to the a" "2 to the b" "3 to the c" "4 to the a" "5 to the b"
"6 to the c" "7 to the a" "8 to the b" "9 to the c" "10 to the a"
② substr
paste와 반대로 주어진 문자열에서 특정 문자열을 추출하는 기능을 한다.
ex)
substr("BigDataAnalysis",1,4)
#Result
"BigD"
country=c("Korea", "Japan", "China", "Singapore", "Russia")
substr(country, 1, 3)
#Result
"Kor" "Jap" "Chi" "Sin" "Rus"
③ 자료형 데이터 구조 변환
주어진 객체의 데이터 구조를 다른 구조로 바꾸자 할 때 다음과 같은 함수들을 사용해 변환할 수 있다.
⊙ as.data.frame(x) : 데이터 프레임 형식으로 변환한다.
⊙ as.list(x) : 리스트 형식으로 변환한다.
⊙ as.matrix(x) : 행렬 형식으로 변환한다.
⊙ as.vector(x) : 벡터 형식으로 변환한다.
⊙ as.factor(x) : 팩터(factor) 형식으로 변환한다.
ex)
as.integet(3.14)
#Result
3
as.numeric("foo")
#Result
NA
경고메시지:
강제형변환에 의해 생성된 NA입니다.
논리값인 TRUE와 FALSE를 수치형으로 변환할 때는 FALSE를 0으로, TRUE를 1로 바꾼다.
반대로 수치를 논리값으로 변경할 때는 0인 경우에만 FALSE가 되고 0이 아니라면 TRUE가 된다.
as.charactor(101)
#Result
"101"
as.numeric(FALSE)
#Result
0
as.logical(0.45)
#Result
TRUE
as.matrix 함수를 이용해 데이터 프레임을 행렬로 변환할 수 있다.
mydat
#Result
income car marriage
1 100 kia FALSE
2 200 hyundai FALSE
3 150 kia FALSE
4 300 toyota TRUE
5 900 lexus TRUE
as.matrix(mydat)
#Result
income car marriage
[1,] "100" "kia" "FALSE"
[2,] "200" "hyundai" "FALSE"
[3,] "150" "kia" "FALSE"
[4,] "300" "toyota" "TRUE"
[5,] "900" "lexus" "TRUE"
④ 문자열을 날짜로 변환
⊙ Sys.Date(): 현재 날짜를 반환한다.
⊙ as.Date(): 날짜 객체로 변환한다.
ex)
as.Date("2015-01-13")
#Result
"2015-01-13"
as.Date("01/13/2015")
다음에 오류가 있습니다charToDate(x) : 문자열이 표준서식을 따르지 않습니다.
as.Date("01/13/2015", format="%m/%d/%Y")
#Result
"2015-01-13"
⑤ 날짜를 문자열로 변환
⊙ format(데이터, 포맷)
⊙ as.character()
ex)
as.Date("08/13/2013", format="%m/%d/%Y")
#Result
"2015-01-13"
format(Sys.ZDate())
#Result
"2015-01-13"
as.character(Sys.Date())
#Result
"2015-01-13"
format(Sys.Date(), format="%m/%d/%Y")
#Result
"01/13/2015"
format의 옵션을 이용하면 Date 객체에서 요일이나 날짜만을 간편하게 추출할 수 있다.
format(Sys.Date(), '%a') # '%a'는 요일을 출력한다.
#Result
"화"
format(Sys.Date(), '%b') # '%b'는 월을 출력한다.
#Result
"1"
format(Sys.Date(), '%m') # '%m'은 두자리 숫자로 월을 출력한다.
#Result
"01"
format(Sys.Date(), '%d') # '%d'은 두자리 숫자로 일을 출력한다.
#Result
"13"
format(Sys.Date(), '%y') # '%y'은 두자리 숫자로 연도를 출력한다.
#Result
"15"
format(Sys.Date(), '%Y') # '%Y'은 네자리 숫자로 된 연도를 출력한다.
#Result
"2015"
반응형
LIST
'Programming > R' 카테고리의 다른 글
데이터 마트 - R reshape (0) | 2020.06.25 |
---|---|
R 그래픽 기능 (0) | 2020.06.25 |
R 언어와 문법 - 사용자 정의 함수 (0) | 2020.06.25 |
R 언어와 문법 - 반복 구문과 조건문 (0) | 2020.06.24 |
R 언어와 문법 - 데이터 핸들링 (0) | 2020.06.24 |
Comments