본문 바로가기

R연습 200제/07_00. (R)날짜&문자다루기4

(R)제8강 8.4 정규표현식(이메일 체크 추가 ^^^ ) 오랜만에 정규표현식을 다시 보게 됩니다. 정규표현식은 너무 다양하여 문법을 기억하기도 쉽지 않고 그렇다고 자주 사용하는 것도 아니라서 자주 까먹게 됩니다. 이런 경험은 "레이텍(Latex)" 을 공부할 때에도 느낀 점입니다. 위키백과에서 인용한 글 "grep은 엄밀히 말하면 두문자어(머리글자로 된 말)는 아니지만 global / regular expression / print 에서 각각의 머릿글자를 따 온 것이며 이것은 ed 텍스트 편집기에서 쓰이는 연속적인 지시어이다. grep 명령어는 파일이나 표준 입력을 검색하여 주어진 정규 표현식과 맞는 줄을 찾아 프로그램의 표준 출력으로 출력한다." 일단 다음과 같이 랜덤으로 id 란 벡터를 만들어 봅니다. id는 수시로 고쳐나갈 계획입니다. id >> grep.. 2020. 10. 22.
(R,S)제8강 8.1 날짜다루기(SAS와 R 비교) 날짜다루기는 자주 있는 작업이 아니라도 다시 쓰려고 하면 기억이 가물 가물 SAS에서는 어떻게 하더라... 비슷 비슷해서 헷갈리기도 하고 그려면 R에서는 어떻게 하나? 또 헷갈립니다. 그래서 우선 SAS 부터 정리를 시작해 봅니다.(그래도 만만한게 SAS 인지라) SAS에서는 1960년 1월0일이랑 숫자 0과 같다??? R에서는 1970년 1월1일이랑 숫자0과 같다. R에서는 1970년 1월1일이랑 숫자 0 같다 x 2020. 10. 19.
8.7 문자열 다루기(일단 SAS) 문자열과 관련된 작업은 일상 업무에서 자주 사용됩니다. 이들 함수에는 여러 가지가 있지만 실제로 사용되는 함수는 몇 개 되지 않습니다. 문자변형 관련 함수 중 가장 많이 사용되는 것이 SUBTR 함수로서 이용하여 문자열의 일부를 추출하는데 사용합니다. 또한 문자열의 빈칸을 제거하는 함수 TRIM, LEFT 또는 RIGHT 도 종종 유용하게 쓰입니다. 함 수 명 기 능 BYTE(n) n에 해당되는 ASCII 코드를 리턴합니다 n은 0부터 255까지 입니다. CATX 다수의 문자열을 연결할 때 사용 문자열의 앞뒤 공백문자 제거, 구분자 추가 가능 COMPRESS 문자변수의 일부를 제거할 때 이 FIND source에서 찾는 문자의 위치를 리턴 INDEX 와 유사한 기능 INDEX(source,찾는문자) so.. 2020. 8. 12.
8.2 날짜형 관련 FORMAT 문의 여러가지 형태(SAS 경우) 날짜형을 다루는 명령어로 FORMAT 문이 있는데 이와 관련하여 date문, yymmdd 문이 있습니다. R에서도 이와 유사하게 지원하고 있습니다. 매번 헷갈려서 제가 쓴 "SAS강좌와 통계컨설팅"을 수시로 참조합니다.R 부분은 추후에 올리도록 하겠습니다. 1960년 1월 2일을 다양한 형태로 PRINT하기 - FORMAT 문 형태 프린트 결과 ------------------ --------------- format x1 date5. 02JAN x1 date6. 02JAN x1 date7. 02JAN60 (default) x1 date. 02JAN60 x1 date8. 02JAN60 x1 date9. 02JAN1960 --------------------------------------------- x.. 2020. 8. 12.