TDM2 (R3)제14강(3.1) 텍스트마이닝 - TDM(Term Document Matrix) 텍스트마이닝(Text Mining) 관련 자료를 보다 보면 TDM과 DTM 단어가 나옵니다. 단어 순서만 바뀌어 있어서 헷갈리지만 둘 다 알 필요는 없고 TDM ... T 로 시작하는 것만 우선 이해를 하시면 됩니다. 다음과 같은 자료를 참고로 했습니다. 참고문헌: (1) R을 이용한 빅데이터 분석(임동훈 지음, 자유아카데미) (2) R를 이용한 텍스트마이닝(백영민 지음,한울) 그외 구글링 1. TDM 의 형태 우선 Matrix 이니까 2차원 데이터인 모양이다. Term은 단어이고 세로 방향, 행 Document 문서이니까 가로방향, 열 그리고 각 셀마다 빈도수가 나타나 있습니다. 문서1에는 단어 1이 8개 들어가 있는 것을 볼 수 있습니다. 단어 1은 각 문서(DOC) 마다 많이 들어가 있어 공통으로 .. 2020. 12. 22. (2) 텍스트마이닝 - 말뭉치로 TermDocumentMatrix 형태로 만들기 텍스트마이닝- 패키지 tm 소개(Corpus 말뭉치, tm_map, wordcloud)에 이어서 설명합니다. 앞에서 일단 "crude" 망뭉치 파일(객체)가 있다고 가정합니다. 1단계. 망뭉치로 TDM 행렬을 만든다. tdm 2020. 7. 30. 이전 1 다음