본문 바로가기

조인호83

제2강 2.1 넘파이 사용 - import, np.array( ) Jupyter Notbook 사용시 한 줄 입력하고 Alt+Enter 아니면 Shift+Enter import numpy as np # numpy를 np로 지정 x = np.array([-1.0,1.0,2.0]) # 넘파이에 있는 함수 array를 사용하는 모양 ( ) ... 그 안에는[-1.0,1.0,2.0] 배열인가? x # x 를 프린트해 보니 array 로 나타나는 것을 보니 일단 배열인 모양... np.array를 이용한 결과 y = x > 0 # x 배열의 각 원소와 0 을 비교해 보니 y # False, True, True 가 나오는 구나.... 이제 궁금한 것... 배열은 뭣이고 np.array 는 뭣인가? 를 보면 되겠군... 파이썬 자료형에는 리스트형(list)이 있는데 a = [1,2.. 2020. 8. 13.
8.2 날짜형 관련 FORMAT 문의 여러가지 형태(SAS 경우) 날짜형을 다루는 명령어로 FORMAT 문이 있는데 이와 관련하여 date문, yymmdd 문이 있습니다. R에서도 이와 유사하게 지원하고 있습니다. 매번 헷갈려서 제가 쓴 "SAS강좌와 통계컨설팅"을 수시로 참조합니다.R 부분은 추후에 올리도록 하겠습니다. 1960년 1월 2일을 다양한 형태로 PRINT하기 - FORMAT 문 형태 프린트 결과 ------------------ --------------- format x1 date5. 02JAN x1 date6. 02JAN x1 date7. 02JAN60 (default) x1 date. 02JAN60 x1 date8. 02JAN60 x1 date9. 02JAN1960 --------------------------------------------- x.. 2020. 8. 12.
(R)제05강_다운로드 받은 SAS, SPSS 데이터를 R에서 분석하기 공공기관을 방문하면 관련 데이터를 다운로드할 수 있는데 SAS, SPSS 데이터가 종종 보입니다. 물론 엑셀 데이터로 다운로드 받을 수도 있게 되어 있습니다. SAS, SPSS 형태로 데이터를 다운로드하게 하는 것은 파일만 다운로드 받으면 변수에 대한 정보들을 곧장 이용할 수 있기 때문입니다. 엑셀 특히 csv 파일로 되어 있지만 열어보기 쉽지만, 각 필드에 대한 정보는 별도로 제공하는 레이아웃을 보고, 전처리 등을 거쳐야 합니다. SAS는 확장자가 sas7 bdat로 되어 있고 SPSS는 확장자가 sav 파일로 되어 있습니다. PC에 SAS 나 SPSS 가 설치되어 있으면 다운로드한 파일을 더블클릭하면 자동적으로 해당파일이 열리는 것을 볼 수 있습니다. 그래서 그다음은... 막막 SAS의 경우 1. 나.. 2020. 8. 4.
4.5(g) 한국의료패널 분석하기(R 또는 SAS) - khp.re.kr 1단계. 한국의료패널 데이터 구하기 - khp.re.kr 에 접속 화면 가운데 있는 [데이터] 클릭 2단계. [데이터 활용동의서 다운로드 및 작성] 을 클릭 3단계. 자료유형 SAS( ) 또는 SPSS( ) 선택하여 담당자에게 메일로 보냄 4단계 관련데이터가 E-mail 로 전달 받음 예) khp_version_1.5_SAS.zip (100.47 MB) 전달받은 zip 파일 압축을 풀면 확장자가 sas7.dat 생김 5단계. SAS 또는 R을 이용하여 분석시작 외부에서도 SAS 파일을 다운로드 받은 경우, 그 파일을 곧바로 사용할 수 있습니다. R 에서 SAS시스템 파일(확장자 sas7bdat)를 사용하려면 패키지 sas7bdat 를 사용하면 됩니다. 국민건강영양조사 사이트로 가 보면 화면 아래에 SAS.. 2020. 8. 3.
(S)제7강_01 SAS에서 제공하는 함수 - R 로도 가능 SAS에는 다른 소프트웨어처럼 여러 가지 기능을 가진 내장 함수를 갖고 있어서 이를 알아두면 상당히 편리하게 사용할 수 있습니다. 이런 기능을 모르면 SAS로는 해결할 수 없는 경우가 많으며 “SAS로는 해결할 수 없다.”라고 생각하게 됩니다. SAS 에서 제공되는 함수들은 R에서도 가능합니다. R과 SAS를 서로 비교해 보는 것도 흥미로운 일입니다. (1) 연산(Arithematic) 기능 함수 연산을 담당하는 함수로 다음과 같은 것들이 있습니다. ABS(argument) : 절대값을 계산 DIM(ARRAY명) : ARRAY 문의 원소들의 수 HBOUND(ARRAY명) : ARRAY에 사용된 원소들의 상한값 LBOUND(ARRAY명) : ARRAY에 사용된 원소들의 하한값 MAX(argument, ar.. 2020. 8. 2.
(2) 텍스트마이닝 - 말뭉치로 TermDocumentMatrix 형태로 만들기 텍스트마이닝- 패키지 tm 소개(Corpus 말뭉치, tm_map, wordcloud)에 이어서 설명합니다. 앞에서 일단 "crude" 망뭉치 파일(객체)가 있다고 가정합니다. 1단계. 망뭉치로 TDM 행렬을 만든다. tdm 2020. 7. 30.