목록Language/R (13)
JJUNNAK's

.csv 파일 csv파일은 "comma-separated-values"의 약자로 콤마로 열을 구분한 파일이다. 보통 엑셀이나 메모장같은 텍스트 편집기를 통해서 읽을 수 있다. 아래에서는 airquality 파일을 사용한 예시이다. csv 파일 읽기(read) 우선 경로를 csv파일이 위치한 폴더로 이동해야한다. getwd() 함수를 통해 현재 작업폴더를 알수있다. getwd() # 현재 작업 폴더 확인 setwd() 함수를 사용해서 작업폴더를 지정할 수도있다. setwd("경로") 작업폴더를 csv파일이 위치한 경로로 설정했다면 read.csv("파일명") 함수를 사용하여 읽어올 수 있다. data data.frame header=T 매개변수는 읽어올 파일의 첫번째 줄이 값이아닌 열의..

데이터셋 Dataset 데이터셋이란? 분석을 위하여 2차원의 형태로 모아놓은 자료를 말한다. R에서는 기본적으로 제공해주는 데이터셋들이 있으며 각 패키지에서 제공해주는 데이터셋들도 있다. 데이터셋 정보 확인 [ Iris(붓꽃) 데이터셋 ] iris 데이터셋은 R에 기본적으로 내장되어있는 데이터셋으로 붓꽃의 3가지 종(setosa, versicolor, virginica)에 대해 꽃받침sepal과 꽃잎petal의 길이를 정리한 데이터이다. 데이터셋 불러오기. iris # iris 데이터셋 불러옴 > Sepal.Length Sepal.Width Petal.Length Petal.Width Species 1 5.1 3.5 1.4 0.2 setosa 2 4.9 3.0 1.4 0.2 setosa..
데이터 프레임 (dataframe) 데이터 프레임은 매트릭스와 마찬가지로 2차원 형태의 데이터를 저장하는 자료구조이다. 매트릭스와의 차이점은 데이터프레임에는 서로 다른 종류의 값이 저장될 수 있다. 단. 하나의 열에 다른종류의 값은 들어갈 수 없다. 각각의 열들은 각각 같은 종류의 데이터값이 들어가야한다. 데이터 프레임 생성 data.frame() 함수로 생성할 수 있으며 보통 여러개의 벡터를 결합하는 형태로 생성한다. name 짱구 0 class[1:2,] > 이름 점수 1 짱구 0 2 훈이 30 class[,-1] # 1열(이름) 을 제외하고 출력. > 0 30 90 colnames(class) 이름 점수 1 짱구 0

매트릭스 (Matrix) 매트릭스는 2차원 형태의 데이터를 저장하고 분석할때 사용되는 자료구조이다. 매트릭스에 저장되는 모든 자료의 data type은 동일해야 한다. 보통 숫자로만 구성된 2차원자료를 저장하고 처리한다. 2차원 데이터 2차원 데이터는 1차원 구조의 데이터들이 모여서 만들어지는 데이터로 행 과 열의 방향성을 가지는 데이터 구조이다. 2차원 데이터는 테이블 형태로 표현되는데 가로줄은 행,Row,관측값 세로줄은 열,Column, 변수 라고 부른다. 매트릭스 생성 매트릭스 생성 # 변수명