문디 3주차 | Data frame & Lists
-
Upload
- -
Category
Data & Analytics
-
view
273 -
download
0
Transcript of 문디 3주차 | Data frame & Lists
2015.08.15 동철
Chapter 5, 6Data frame / Lists
Data camp : R
모두 mtcars 를 입력합니다.
mtcars !
너..무.. 많다
읽기엔 너무 많고 안 읽곤 파악이 안 된다!
“ 일단 개요(Overview)만 딱 보고 싶은데 ”
..
..
Moon.D
head(mtcars)
Moon.D
tail(mtcars)
str(mtcars)
깔끔 트리오 등장, 이 분들이 정리해주십니다.
데이터의 일부분을 살펴보는 게 상당히 유용할 것! 첫 번째로는 'head()’ 는 first observations 볼 수 있다. ‘tail()’과 같은 경우는 데이터세트의 마지막 뒷 부분을 볼 수 있다.
Observations
Variables
Moon.D
그런데 이번 단원 이름이... data frame...
그게 뭔데?_?
You construct a data frame with the data.frame() function.
Do not forget that it is possible (and likely) that they contain different types of data.
planets_df 란 이름으로 완성합시다!Q.data.frame()
planets type diameter rotation rings
planets_df <- data.frame(planets, type, diameter, rotation, rings)
Moon.D
Moon.D
일단 스펙 좀 볼까?
str()사실은 “너, 서류(Seo-ryu) 탈락(Talak) 다시(Re) 약자”라고 한다. 드립 ㅈㅅ
싫습니다. 전 딱 필요하신 부분만 보여드립니다.
궁금하신 부분 것만, 딱 찝어주세요!
“
...
.
‘1-3행’ 이면서 ‘2-4열’의 데이터 불러오고 싶다면?
Planets_df 의
힌트 [ : ]
Q.
“우리 잊으면 안돼..!” something[1,] / something[,1]힌트
Q. Jupiter의 행을 불러내고 싶다면?
Moon.D
data_frame_name$variable_name
헷갈린다. 좀 더 명료한 것 없을까?
planets_df$rings->
planets_df[,5]planets_df[5,]
Moon.D
planets_df$rings
planets_df[rings,] 똑똑이 R !
planets_df[,5]
이거 말고! rings 해당 데이터 다 보고 싶은데
Moon.D
planets_df의 1,2,3행의 데이터 값들을 보고 싶다면? Q.
[:] <----- “우리 잊으면 안돼!힌트
Moon.D
GOOD!
Bad!
Moon.D
근데, 간단한 방법이 또 있더래요( 진작에 알려주지 쫌;)
Moon.D
* Subset = 부분집합
subset(planets_df, subset=something)
흐음...! rings 가 존재하는 값만 보고 싶구만~~!
덜 억울하군. 아주 간단하진 않네!
subset(planets_df, subset=rings)
Moon.D
Moon.D
똑똑이 R을 시험해볼까?
Q. subset 함수를 이용해서 1보다 작은 diameter 값의 데이터만 보려면?
똑똑이 R !!!!!!!!!!!
Moon.D
그래... 데이터 골라볼 수 있고 좋은데 순위도 매길 순 없나?
ㅋ 똑똑이 R은 가능해ㅎ지금 무시함?
Moon.D
ranking <- c(99,101,95,102)1. 아래와 같이 만들어 주고
order() 함수를 써보자!
......?! 조금 혼란이..?
ranking[order(ranking)]
똘망똘망한 녀석이구려!
Moon.D
-> sth[order(sth)]
Moon.D
내 data.frame으로 정리를...
diameter_rank <- order(planets_df$diameter, decreasing = TRUE )
diamete_rank 를 내림차순으로 순서대로 보고싶다면?Q.
planets_df[diameter_rank,]
Moon.D
낯설죠?
ex) planets_df[rings,]
Chapter6. Lists
Moon.D
list리스트는 합치는 걸 이야기합니다!
object들을 입력된 순서대로 합쳐주죠.... 이러한 object들은 행렬 벡터 데이터 프레임 혹은 다른 lists 들이 될 수 있죠.심지어 object들 간에 연결이 되어 있지 않아도 가능합니다.
list()
Moon.D
해봅시당!
my_list <- list(my_vector, my_matrix, my_df)
my_list를 입력해보면?
my_vector, my_matrix, my_df 일단 한 번씩 보고...
Moon.D
물론 예전에 했던 거랑 비슷하긴 합니다. 그러나 이번엔 더 쉽고 더 간단히!
my_list <- list(my_vector, my_matrix, my_df)names(my_list) <- c(“vec”, “mat”, “df”)
my_list <- list( vet = my_vector , mat= my_matrix, df = my_df)
Moon.D
주의 ( 바꾼 이름에 숫자만 딸랑 들어가면 안돼요... 문자가 같이 들어가줘야 해용)
왜 때문이죠?
my_list <- list( 1 = my_vector , 2 = my_matrix, 3 = my_df)
오류!!!!
Moon.D
붙여주기만 하니 허전해...! 이름도 정해주고 싶네?
my_moondy <- list( studyname= “Moondy”, a = my_vector , b = my_matrix, c = my_df)
Moon.D
이번에도 일부분만 보고 싶다면?
Moon.D
my_moondy[[2]]my_moondy[[2]][1]my_moondy[[3]][1,]
my_moondy[[“a”]]
my_moondy[[“b”]]위와 동일한 데이터를 불러오는 명령어는 각각?
무언가 빠트린 게 있다면?c(list1, new_name = some_variable)
Moon.D
Moon.D
c(list1, new_name = some_variable)
Moondy_list <- c(my_moondy, year = 2015)
오오....!
Chapter 5, 6Data frame / Lists
Data camp : R
5,6 잊으면 안돼~!!