전체 글 99

데이터 요약하기(Summarizing)

cut 함수: 도수분포표 작성 cut 함수는 숫자형 벡터를 요인형으로 구분해준다. 엄밀히 말하여 도수분포를 작성해주는 것은 아니다. 예를 들어, 학생들의 키 벡터가 height = c(152cm, 170cm, 160cm, 155cm, 180cm) 와 같이 제시되어 있고 cut 함수로 학생들의 키를 세 개 구간으로 나눈다고 하면 다음 같이 세 개 구간을 알려준다. [152, 161), [161, 171), [171, 180) 여기서 각 구간이 요인(factor)이 된다. height[1]의 경우 152이므로 [152, 161)에 구간에 해당한다. career 데이터의 gradM 변인을 3개 구간으로 cut 하면 아래와 같이 head 함수로 출력한 첫 6개 데이터는 200이하인 관측값이 5개, 400 초과,..

R|Rstudio 2018.06.07

양재시민의 숲 스냅 (SONY a7r + FE24-70za)

S Y N O P S I S #양재시민의 숲 # 양재시민의 숲 다리가 아파서 걷는게 불편해도 날이 좋아서 무언가에 홀린 것처럼 사진을 찍으러 간다. 주차장을 지나가던 순간 차 번호를 봤는데 2875였다.'아 탐론 2875 사야되는데..'이쯤 되면 미친 게 아닌가 싶다. # 양재시민의 숲은 정말 넓은데, 그 중 카페거리가 있는 곳이다. 밤이 되면 은은한 가로등도 있고 분위기가 좋다. 나무 사이로 들어오는 빛이 좋아서 한 컷. # 왠 양귀비? 양귀비 하면 아편밖에 모르는데(무식이 하늘을 찌른다..). 줄기에 털이 보송보송 나 있는 녀석들은 아편 양귀비가 아니라 꽃 양귀비라고 한다. 적녹색약이라 붉은색이 눈에 잘 들어오지 않는 나에게도 붉다.

그날 2018.06.04

포천 허브 아일랜드 스냅 (SONY a7r + FE28-70mm)

S Y N O P S I S #포천 허브아일랜드 # 포천 허브아일랜드 경기도 포천시에 있는 허브아일랜드 어마어마하게 큰 규모로 조성된 테마파크이다. 차가 없이는 찾아가기 어려울 정도로 산 깊숙한 곳에 있다. 주차할 곳은 많아서 걱정할 필요는 없겠다. 다 마음에 들었는데 안내 팜플랫 지도가 보기 어렵게 되어있다. 처음엔 지도보고 계획적으로 다니려다가 포기하고 돌아다녔다. # 포천 허브아일랜드의 입구에 위치한 베네치아 랜드(?). 허브아일랜드를 방문하게 만든 가장 큰 이유. 이탈리아 베네치아를 따서 만든 곳. 나름 곤돌라도 있고 곤돌라 탑승 체험도 할 수 있다. (누군가는 열심히 페달을 밟아야 한다.) 5천원 정도였던 것으로 기억한다. 어른들보단 아이들이 참 좋아할 것 같다. # 로즈마리에 이런 꽃이 핀다는..

그날 2018.05.27

#2 데이터 가공하기(Manipulating)

데이터 확인(Checking) 작업을 통해 이상한 점, 분석하기 어려운 자료 구조 등을 파악한 뒤에는 분석하기 용이하도록 데이터를 가공할 필요가 있다. 이러한 과정에는 데이터의 추가, 삭제, 변형 등이 있다. 이와 같은 과정을 모두 끝낸 후에 비로소 올바른 데이터 분석이 가능해진다. R 관련 함수 전체 보기 transform 함수: 변수 계산을 통한 신규 변수 생성 career 객체는 지난번 #1 데이터 확인하기 포스팅에서 다룬 진로현황 자료이다. 특별한 사유가 없는 한 앞으로 본 데이터를 가지고 지속적으로 포스팅 할 예정이다. str() 함수를 통해 career의 데이터를 살펴보니 남, 녀 졸업생 각각은 있지만 졸업생 합계 데이터가 없다. 앞으로 자주 쓰일 변수일테니 남, 녀 졸업생 합계 변수를 새로 ..

R|Rstudio 2018.05.22