collocate.Rd
공동발생 분석을 위한 공동발생 단어 추출 및 해당 단어의 공동발생 빈도 및 문서에서의 발생 빈도 정보 생성
collocate(
x,
node,
span = 3,
type = c("noun", "noun2", "verb", "adj", "morpheme")
)
character. 공동발생(co-occurrences) 분석에 사용할 document.
character. 공동발생 분석 단어(term)
integer. 공동발생 window 단위. 기본값은 3.
character. 공동발생에 사용할 단어를 생성하는 방법으로서의 형태소 분석의 결과 유형. 모든 품사, 명사, 동사 및 형용사와 같은 토큰화 결과 유형을 지정. "morpheme", "noun", "noun2", "verb", "adj"중에서 선택. 기본값은 "noun"로 일반명사만 추출함.
data.frame. 공동발생 정보를 담은 data.frame
# \donttest{
docs <- president_speech$doc[1]
# default arguments
collocate(docs, "우정")
#> Term Before After Span Total
#> 1 가슴 1 0 1 1
#> 2 개막식 0 1 1 1
#> 3 계기 0 1 1 1
#> 4 국민 1 1 2 5
#> 5 노력 1 0 1 1
#> 6 때 0 1 1 1
#> 7 보람 0 1 1 1
#> 8 불 1 2 3 2
#> 9 사이 1 0 1 3
#> 10 성공 0 1 1 2
#> 11 양국 2 1 3 8
#> 12 우정 1 1 2 5
#> 13 이틀 0 1 1 1
#> 14 일 1 0 1 1
#> 15 자리 1 1 2 3
#> 16 적극 1 0 1 2
#> 17 전 0 1 1 3
#> 18 축하 0 1 1 2
#> 19 해 1 1 2 3
#> 20 우정 NA NA 5 5
#> 21 [[TOKENS]] 12 15 27 148
# change span argument
collocate(docs, "우정", span = 4)
#> Term Before After Span Total
#> 1 가슴 2 0 2 1
#> 2 개막식 0 1 1 1
#> 3 계기 0 1 1 1
#> 4 국민 2 1 3 5
#> 5 노력 1 0 1 1
#> 6 때 0 1 1 1
#> 7 보람 0 1 1 1
#> 8 불 2 3 5 2
#> 9 사이 1 1 2 3
#> 10 생각 0 1 1 2
#> 11 성공 0 1 1 2
#> 12 수교 1 0 1 1
#> 13 양국 2 1 3 8
#> 14 우정 1 1 2 5
#> 15 이틀 0 1 1 1
#> 16 일 1 0 1 1
#> 17 자리 1 1 2 3
#> 18 적극 1 0 1 2
#> 19 전 0 1 1 3
#> 20 주최 0 1 1 1
#> 21 축하 0 1 1 2
#> 22 해 1 1 2 3
#> 23 행사 0 1 1 2
#> 24 우정 NA NA 5 5
#> 25 [[TOKENS]] 16 20 36 148
# change type argument
collocate(docs, "우정", type = "morpheme")
#> Term Before After Span Total
#> 1 , 1 0 1 10
#> 2 같 1 0 1 1
#> 3 개막식 0 1 1 1
#> 4 국민 1 0 1 5
#> 5 따뜻 1 1 2 2
#> 6 불 0 2 2 2
#> 7 사이 1 0 1 3
#> 8 성공 0 1 1 2
#> 9 시킬 0 1 1 1
#> 10 양국 1 0 1 8
#> 11 에 1 0 1 8
#> 12 와 1 0 1 4
#> 13 으로 0 1 1 5
#> 14 은 1 0 1 9
#> 15 을 0 3 3 13
#> 16 을수록 1 0 1 1
#> 17 의 2 3 5 12
#> 18 일 1 0 1 5
#> 19 하 0 1 1 16
#> 20 한 2 0 2 7
#> 21 해 0 1 1 5
#> 22 우정 NA NA 5 5
#> 23 [[TOKENS]] 15 15 30 617
# }