728x90
텍스트마이닝- 패키지 tm 소개(Corpus 말뭉치, tm_map, wordcloud)에 이어서 설명합니다.
앞에서 일단 "crude" 망뭉치 파일(객체)가 있다고 가정합니다.
1단계. 망뭉치로 TDM 행렬을 만든다.
tdm <- TermDocumentMatrix(crude)
# TermDocumentMatrix 함수는 패키지 tm에 들어있는 것 지난 시간에 확인하셨지요.
class(tdm) # [1] "TermDocumentMatrix" "simple_triplet_matrix"
tdm
2단계. TDM을 행렬로 바꿔 확인
as.matrix(tdm)
'R강좌와 통계컨설팅 - 통계편 > 31_00. R 응용' 카테고리의 다른 글
(R3)제14강(3.1) 텍스트마이닝 - TDM(Term Document Matrix) (0) | 2020.12.22 |
---|---|
(4) 텍스트마이닝 - 문서간의 유사도(Similarity) (0) | 2020.08.01 |
(R1)제15강(3.2) 텍스트마이닝- 패키지 tm 소개(Corpus 말뭉치, tm_map, wordcloud) (0) | 2020.07.30 |
(R1)제15강(0.0) R 응용(II) 목차 - 워드클라우드, 텍스트마이닝, 장바구니, Shiny 등 (0) | 2020.07.15 |
(R1)제15강(1.1) 워드클라우드(wordcloud) 간단하게 실행해 보기 (0) | 2020.06.03 |