분류 전체보기 99

데이터 요약하기(Summarizing)

cut 함수: 도수분포표 작성 cut 함수는 숫자형 벡터를 요인형으로 구분해준다. 엄밀히 말하여 도수분포를 작성해주는 것은 아니다. 예를 들어, 학생들의 키 벡터가 height = c(152cm, 170cm, 160cm, 155cm, 180cm) 와 같이 제시되어 있고 cut 함수로 학생들의 키를 세 개 구간으로 나눈다고 하면 다음 같이 세 개 구간을 알려준다. [152, 161), [161, 171), [171, 180) 여기서 각 구간이 요인(factor)이 된다. height[1]의 경우 152이므로 [152, 161)에 구간에 해당한다. career 데이터의 gradM 변인을 3개 구간으로 cut 하면 아래와 같이 head 함수로 출력한 첫 6개 데이터는 200이하인 관측값이 5개, 400 초과,..

R|Rstudio 2018.06.07

양재시민의 숲 스냅 (SONY a7r + FE24-70za)

S Y N O P S I S #양재시민의 숲 # 양재시민의 숲 다리가 아파서 걷는게 불편해도 날이 좋아서 무언가에 홀린 것처럼 사진을 찍으러 간다. 주차장을 지나가던 순간 차 번호를 봤는데 2875였다.'아 탐론 2875 사야되는데..'이쯤 되면 미친 게 아닌가 싶다. # 양재시민의 숲은 정말 넓은데, 그 중 카페거리가 있는 곳이다. 밤이 되면 은은한 가로등도 있고 분위기가 좋다. 나무 사이로 들어오는 빛이 좋아서 한 컷. # 왠 양귀비? 양귀비 하면 아편밖에 모르는데(무식이 하늘을 찌른다..). 줄기에 털이 보송보송 나 있는 녀석들은 아편 양귀비가 아니라 꽃 양귀비라고 한다. 적녹색약이라 붉은색이 눈에 잘 들어오지 않는 나에게도 붉다.

그날 2018.06.04

포천 허브 아일랜드 스냅 (SONY a7r + FE28-70mm)

S Y N O P S I S #포천 허브아일랜드 # 포천 허브아일랜드 경기도 포천시에 있는 허브아일랜드 어마어마하게 큰 규모로 조성된 테마파크이다. 차가 없이는 찾아가기 어려울 정도로 산 깊숙한 곳에 있다. 주차할 곳은 많아서 걱정할 필요는 없겠다. 다 마음에 들었는데 안내 팜플랫 지도가 보기 어렵게 되어있다. 처음엔 지도보고 계획적으로 다니려다가 포기하고 돌아다녔다. # 포천 허브아일랜드의 입구에 위치한 베네치아 랜드(?). 허브아일랜드를 방문하게 만든 가장 큰 이유. 이탈리아 베네치아를 따서 만든 곳. 나름 곤돌라도 있고 곤돌라 탑승 체험도 할 수 있다. (누군가는 열심히 페달을 밟아야 한다.) 5천원 정도였던 것으로 기억한다. 어른들보단 아이들이 참 좋아할 것 같다. # 로즈마리에 이런 꽃이 핀다는..

그날 2018.05.27

#2 데이터 가공하기(Manipulating)

데이터 확인(Checking) 작업을 통해 이상한 점, 분석하기 어려운 자료 구조 등을 파악한 뒤에는 분석하기 용이하도록 데이터를 가공할 필요가 있다. 이러한 과정에는 데이터의 추가, 삭제, 변형 등이 있다. 이와 같은 과정을 모두 끝낸 후에 비로소 올바른 데이터 분석이 가능해진다. R 관련 함수 전체 보기 transform 함수: 변수 계산을 통한 신규 변수 생성 career 객체는 지난번 #1 데이터 확인하기 포스팅에서 다룬 진로현황 자료이다. 특별한 사유가 없는 한 앞으로 본 데이터를 가지고 지속적으로 포스팅 할 예정이다. str() 함수를 통해 career의 데이터를 살펴보니 남, 녀 졸업생 각각은 있지만 졸업생 합계 데이터가 없다. 앞으로 자주 쓰일 변수일테니 남, 녀 졸업생 합계 변수를 새로 ..

R|Rstudio 2018.05.22

#1 데이터 확인하기(Checking)

항상 본인이 다루는 데이터가 어떤 모습을 띠고 있는지 확인할 필요가 있다. R을 처음 만질 때는 이런 정보를 잘 확인하지 않게 된다. 빨리 결과를 보고싶기 때문... 그런데 우여곡절 끝에 결과값을 도출해놓고 보면, 십중팔구 '어 이상한데?' 스러운 상황이 연출된다. 결국엔 str이나 summary를 통해서 데이터를 살펴볼 수밖에 없다. 이런 과정을 통해서 내가 가진 데이터를 깎아내고, 다듬고, 칠하고 등등... 가공을 거쳐 완벽한 데이터셋을 만드는 작업이 필요하다는 생각에 이르게 된다. R을 본격적으로 다루게 되는 시점이 바로 이 지점이다. R 관련 함수 전체 보기 str 함수: 객체에 대한 정보를 요약적으로 제시 career 객체는 한국교육학술정보원(2017)의 고등학교 졸업자 진로현황 데이터를 가공하..

R|Rstudio 2018.05.21

[R/RStudio] #0 기본 코드 정리

S Y N O P S I S #R 기본 코드 정리 # 최근 회사 업무를 하면서 SPSS의 한계..라고 할지,# 아무튼 SPSS에서 제공하는 인터페이스에 불편함이 있어서 R을 배우게 되었다. # 주로 활용하는 통계 분석 툴, 방법 등을 정리하는 차원에서 포스트를 할 것이고, # 이후의 포스트에서도 설문결과에 대한 통계분석을 실시하는 데 필요한 툴을 다룰 예정이다. # R에서 사용하는 용어와 일반적인 프로그래밍 언어에서 사용하는 용어가 약간 다른 부분이 있다. # 언어적인 차원에서 다르다는 것이 아니라 언어를 이루는... 세계관이 다르다고 해야 하나, # 어쨌든 통계를 베이스로 하는 프로그램이라 수리/통계적 용어가 혼용된다. R/Rstudio 기본 코드들 정리 #객체(Object) 및 변수 설정들 x = 1..

R|Rstudio 2018.05.14

[경기도 안성] 고삼저수지 스냅 (SONY a7r + FE 35mm F2.8za)

S Y N O P S I S #몽환적인 물안개, 고삼저수지(고삼호수) # 고삼저수지 경기도 안성에 있는 고삼저수지 5~6월 즈음 새벽녘에 피어오르는 물안개가 몽환적인 분위기를 자아내는 곳이다. 큰 맘 먹고 삼각대까지 챙겨서 사진 찍어보자고 왔는데어쩜 주말만 되면 날씨가 이모양인지..네비를 찍고 가도 여기가 거긴가 긴가민가 한다. 사진찍는 사람들 사이에선 유명한 포인트가 있는 듯한데찾아보지도 않고 무작정 가는 바람에 조금 헤맸다. 글 말미 지도에는 두 군데 포인트를 찍어놓았다.그냥 '고삼저수지'를 찍고서 가면 이상한 연구소로 안내해주니 직접 포인트를 조작해서 찾아가는 편이 낫다.집으로 돌아가는 길에 꽃뫼를 지나쳤는데, 상당히 괜찮다. 한번 들러서 촬영 포인트를 찾아가는 것도 좋다. # 일출을 기대하며 머릿..

그날 2018.05.14

[경기도 화성] 우음도 스냅 (SONY a7r + FE35mmF2.8za)

S Y N O P S I S #소의 울음소리, 우음도 # 우음도 경기도 화성시에 자리하고 있는 우음도 어린이날을 품은 이번 연휴엔 어딜 가도 사람이 많을 것 같았다. 그래서 찾은 곳이 우음도. 사실 이곳도 사람이 많을 것이라 생각했는데 거짓말처럼 여기 있는 한 시간 동안 단 한 사람도 볼 수 없었다. 눈치게임의 승자였던 것일까. 복잡하고 사람이 많은 곳을 피해 마음을 정리하고 싶다면 우음도를 추천한다. # 광활한 우음도에 펼쳐진, 갈대를 닮은 이 풀을 '삘기'라고 부른다. 이름이 참 특이한데 갈대처럼 높게 자라지 않고, 끝이 솜털처럼 하얗게 생겼다. 바람에 일렁이는 모습을 보면 산호초같기도 하고, 하얀 물고기떼 같다. 빛을 받으면 더욱 하얘져서 묘한 감정을 불러일으킨다. # 무언가 떨어질 것만 같은 하늘..

그날 2018.05.07