R|Rstudio

[R/RStudio] #0 기본 코드 정리

루아흐뉴마 2018. 5. 14. 23:30
반응형

S Y N O P S I S #R 기본 코드 정리

# 최근 회사 업무를 하면서 SPSS의 한계..라고 할지,

# 아무튼 SPSS에서 제공하는 인터페이스에 불편함이 있어서 R을 배우게 되었다.

# 주로 활용하는 통계 분석 툴, 방법 등을 정리하는 차원에서 포스트를 할 것이고,

# 이후의 포스트에서도 설문결과에 대한 통계분석을 실시하는 데 필요한 툴을 다룰 예정이다. 

# R에서 사용하는 용어와 일반적인 프로그래밍 언어에서 사용하는 용어가 약간 다른 부분이 있다.

# 언어적인 차원에서 다르다는 것이 아니라 언어를 이루는... 세계관이 다르다고 해야 하나,

# 어쨌든 통계를 베이스로 하는 프로그램이라 수리/통계적 용어가 혼용된다.



R/Rstudio 기본 코드들 정리


#객체(Object) 및 변수 설정들
x = 123            # 프로그래밍에서 일반적인 값 할당 방식
myNum <- 123       #보통 개체에 값을 할당할 때 등호(=)를 사용하는데, R에서는 등호도 되지만 <- 기호가 빈번히 쓰인다.
                              #대입한다는 의미에서 <-가 더 직관적이다.


#Checking    (링크)Checking 관련 함수 상세 설명
getwd() #현재 작업경로(Working Directory)를 반환한다.  ex) "C:/Users/User1/Desktop" 현재는 바탕화면
setwd() #작업경로를 임의로 설정한다. ex) "C:/Users/User1/Documents" 내문서로 작업경로 설정
str(@Object) #@Object에 대한 각종 정보를 요약적으로 보여준다.


#Reading/Writing
myData <- read.csv("myStat.csv")    # 현재 작업경로 내에 myStat.csv 파일이 있다면 읽어들여서 myData 개체로 설정한다.
myData <- read.csv("c:/Users/User1/Documents/myStat.csv") #작업경로에 파일이 없다면 직접 설정하여 읽어들인다.


#Indexing

grep("@VariableName", names(@Object)) #@Object 내의 변수명(VariableName)의 Index를 반환한다. @Object에 변수가 많아서 인덱싱이 어려울 때 활용
which(names(@Object)=="@VariableName") #위 코드와 같은 결과값 반환. 위 방식보다는 이게 더 직관적인 듯하다. which 함수가 더 자주 쓰이는 듯하고.



#Manipulating

# transform 함수: DataFrame 내에서 새로운 변수 생성
# @object가 Attach되는 함수이다. 따라서 후행 인자는 @object를 반복하여 사용하지 않아도 된다.
# 기본적으로 일시적인 활용도를 극대화한 함수이다.
# R을 조금 만져보니, 이런식으로 일시적인 활용도를 높인 함수가 여럿 있는데, 자주 사용하지는 못하겠다.
# 보다 유연한 상황에서 변수를 생성하려면 다른 함수를 사용해야 한다.
transform('_data', ...) #기본 구문 DataFrame을 반환하는 듯하다.
@object <- transform(@object, @tag=@value) #인자 구성(@object의 @tag 변수를 생성하는데, 그 값을 @value로 지정)
jobs <- transform(jobs, logIncome = log10(Income)) #jobs 데이터셋의 Income 변수에 로그를 취하고 logIncome 변수로 지정하여 jobs 데이터셋에 추가
jobs <- transform(jobs, avgStress = (stress1 + stress2 + stress3) / 3) #jobs 데이터셋의 stress1, 2, 3의 평균값을 avgStress 변수로 지정하여 jobs 데이터셋에 추가




 Copyright (2018) Ruahneuma. All Rights Reserved.



반응형