본문 바로가기

R & SAS 300제22

행과 열의 합계 구하기 - apply계열(sapply, lapply, tapply), aggregate [R] (1)행렬에 apply 적용하기 > m23 2021. 11. 17.
표본추출하기 - sample 함수 머신러닝에서 많이 사용되는 표본추출에 대하여 설명하겠습니다. 우선 난수 10개를 구하는 프로그램 부터 시작합니다. [R] > sample(10) # 샘플 10개 #[1] 2 9 1 7 8 3 10 6 5 4 sample(10)은 10개의 난수를 발생하는데 매번 그 결과가 달라집니다. 그리하여 set.seed() 함수를 사용하여 초기치(시드)를 할당하면 매번 같은 결과를 만들 수 있습니다. > sample(10) # 샘플 10개 # [1] 6 10 7 2 3 4 1 8 5 9 10개의 숫자를 이용하여 샘플 3개를 구하는 프로그램입니다. > sample(10,3) # 샘플 3개 # [1] 5 2 1 > set.seed(123) > sample(10,3) # 샘플 3개 # [1] 3 10 2 10개의 숫자를 .. 2021. 11. 17.
데이터를 정렬하기 - SAS, R - sort, order, decreasing 데이터셋을 오름차순 또는 내림차순으로 정렬하는 프로그램입니다. [SAS] DATA a1; INPUT gender $ wei hei age join $10.; CARDS; F 65 171 23 2002-01-23 F 66 172 24 2002-02-28 F 69 176 38 2003-01-23 M 67 173 43 2003-05-05 M 68 177 40 2004-03-31 M 72 178 42 2004-06-24 ; DATA a2;SET a1; PROC SORT;BY wei; # 데이터를 변수 wei 의 오름차순으로 정렬 PROC PRINT; RUN; DATA a3;SET a1; PROC SORT;BY DESCENDING wei ; # 데이터를 변수 wei 의 내림차순으로 정렬 PROC PRINT; RU.. 2021. 11. 16.
미싱(Missing) 처리하기 - is.na( ), sum(is.na( )), na.rm, na.omit Missing 인 경우 다루는 문제입니다. 관련 함수로는 is.na( ), sum(is.na( )), na.rm=TRUE, na.omit 등이 있습니다. [SAS 프로그램] 성별(gender)가 "M"이 "N" 으로 잘못 입력되어 있습니다. 몸무게(wei) 가 99로 입력되어 있는데 실제로는 72입니다. DATA a1; INPUT gender $ wei hei age join $10.; CARDS; F 65 171 23 2002-01-23 F 66 172 24 2002-02-28 F 69 176 38 2003-01-23 N 67 173 43 2003-05-05 M 68 177 40 2004-03-31 M 99 178 42 2004-06-24 ; PROC PRINT; VAR gender wei hei ag.. 2021. 11. 16.
변수를 Keep 또는 Drop하기 - SAS, R 데이터셋에서 일부 변수를 keep하거나 drop 을 하는 프로그램 입니다. [SAS] DATA a1; INPUT gender $ wei hei age join $10.; CARDS; F 65 171 23 2002-01-23 F 66 172 24 2002-02-28 F 69 176 38 2003-01-23 M 67 173 43 2003-05-05 M 68 177 40 2004-03-31 M 72 178 42 2004-06-24 ; PROC PRINT;VAR gender wei hei age join; RUN; DATA a2;SET a1;KEEP gender wei hei; /* SAS데이터셋 a1에서 변수 gender, wei, hei 만 Keep */ PROC PRINT;RUN; DATA a3;SET a.. 2021. 11. 16.
SAS, R, Python 으로 하는 회귀분석 SAS, R, Python 으로 하는 간단한 회귀분석 프로그램입니다. [SAS 프로그램] DATA a1;INFILE 'D:\sas_class\simple.csv' DLM=","; INPUT gender $ wei hei age join $10.; PROC REG;MODEL wei=hei; RUN; [R 프로그램] setwd("d:/sas_class") a1 2021. 11. 15.