본문 바로가기

r강좌29

r_01_05. R 패키지 살펴보기 R 에는 10,000 개가 넘는 패키지가 있으며, 이 패키지는 수많은 통계학자와 프로그래머들이 계속 개발하고 배포하고 있습니다. 이렇게 많은 패키지들을 전부 살펴 보는 것은 거의 불가능하지만 나의 PC에 어떤 패키지들이 설치되어 있는지를 살펴보는 것은 필요합니다.  1. 설치되어 있는 패키지 목록보기 – library( )  우선 나의 PC에 설치되어 있는 패키지를 알아보도록 하겠습니다. R을 다운로드하여 설치하면 만 여개가 넘는 R 패키지 중에서 기본적으로 30 여개 정도의 패키지가 설치됩니다. 그리고 새로운 패키지가 있으면, 필요할 때마다 불러와서 PC에 저장하게 됩니다. PC에 설치된 패키지들의 목록을 살펴보는 명령문이 바로 library( ) 함수입니다.  > library() 또는 install.. 2020. 8. 31.
(R1)제03강(3.1) 행렬 다루기 - 행렬 만들기, 속성 살펴보기, 요소 접근하기 이번에는 행렬이라는 데이터 객체에 대하여 살펴봅니다. 행렬은 고등학교나 대학교에서 선형대수학 등 수학에서 다루었던 기억이 있을 것입니다. 이렇게 수학에서 사용되면서 일반인들에게 다소 생소한 행렬이 R에서는 데이터의 기본 객체 형태로 사용됩니다. 행렬은 행과 열로 구성된 사각형태의 데이터로 2차원적인 구조를 가집니다. 행렬은 행과 열의 개수, 행과 열의 이름을 속성으로 가지고 있습니다. 앞서 설명한 벡터 여러 개를 행 또는 열로 구성하면 행렬이 됩니다. 행렬은 만드는 방법은 2 가지가 있습니다. 벡터 여러 개를 이용하여 행 또는 열결합하여 만드는 방법과 하나의 벡터를 이용하여 행렬구조로 바꾸는 것입니다. 행렬을 만드는 방법으로 matrix( ) 함수를 이용하거나 다른 데이터 객체에 as.matrix( ) .. 2020. 7. 25.
(R2)제11강(2.1) χ2-검정의 이론적 배경(r2,s2) "왜 χ2 검정을 적용하느냐?"에 대한 무책임 하면서도 가장 정확한 답변은 "해당 통계치가 χ2 분포를 따르기 때문이다."입니다. $$\chi^2 =\sum_i \sum_j (\frac{O_{ij} – E_{ij})^2}{E_ij}$$ 은 자유도 (n1-1) X (n2-1) 인 χ2 분포를 합니다. *** 제가 젊은 시절 처음 통계분석 컨설팅을 하게 되면서 궁금해 했던 부분입니다. 성별*취미생활 분석을 할 때 왜 비모수검정 기법인 카이제곱검정을 적용하는지 궁금했습니다. 카이제곱분포는 비모수적 분포가 아니고, 분산에 관한 모수적 분포라고 배웠습니다. 카이제곱분포는 분산을 분석할 떄 사용되는 분포이고, 카이제곱분포를 따르는 변수 2개를 서로 분모, 분자에 두고 나누면 F 분포를 따른다고 배웠는데 이렇게 분산.. 2020. 7. 24.
(S,R)제23강(01) 카이제곱검정이란? 조사자료분석에서 가장 많이 사용되는 기법이 바로 χ2 (카이제곱이라 읽는다)제곱법(chi square test)입니다. 앞서 다룬 t검정, 분산분석법, 회귀분석법 등은 모수적기법이라 그러고 카이제곱법은 평균값등을 구하지 않는 아주 쉬운(?) 아주 이해하기 쉬운(?) 비모수기법입니다. 그냥 빈도수를 구하여 어쩌구... 저쩌구... 하여 결론을 내리는 간단한 기법입니다. 그런데 이 카이제곱법이 엄청 유용하게 사용됩니다. 카이제곱검정은 명목변인들간의 상호관련성 여부에 관한 검정을 행하는 통계기법입니다. 예를 들면 남녀별로 취미생활에 대한 차이가 있는지를 보고자 할 때 사용하는 방법입니다. 일반 설문조사의 90% 이상이 χ2검정의 적용을 필요로 합니다. 1. 귀하의 성별은 ? (1)남 (2) 여 2. 귀하가 즐.. 2020. 7. 2.
18.2 생존분석 예제 - 패키지 {survival}, 데이터 retinopath, 함수 Surv 생존분석에 많이 사용되는 패키지로는 survival, KMsurv, rms 가 있습니다. 이중에서 패키지 {survival}에 들어있는 데이터 retinopath 를 사용한 예입니다. 당뇨병 환자의 시력 손실을 지연시키기 위한 레이저치료법의 효과를 확인하기 위해 수집된 자료로 총 197명의 당뇨병 환자 한쪽 안에는 레이저치료를 진행하고 다른 안에는 치료를 진행하지 않은 상태에서 각 안의 시력상실까지의 시간을 관찰한 자료입니다. # 참고문헌: https://doi.org/10.21561/jor.2018.3.1.1. 사용되는 Surv( ) 함수에는 "생존시간"을 나타내는 변수와 "사건 발생 여부"를 나타내는 변수를 사용합니다. install.packages("survival") library(survival.. 2020. 7. 2.