coll_scores.Rd
공동발생 분석을 위한 공동발생 단어에 대한 t-score, MI(mutual information)-score 계산
coll_scores(x, node, span = 3)
data.frame. "collocate()"를 수행한 공동발생(co-occurrences) 분석결과
character. 공동발생 분석 단어(term)
integer. 공동발생 window 단위. 기본값은 3.
data.frame. 공동발생 정보와 T-score, MI-score를 담은 data.frame
# \donttest{
docs <- president_speech$doc[1]
# default arguments
collocate(docs, "우정", type = "morpheme")
#> Term Before After Span Total
#> 1 , 1 0 1 10
#> 2 같 1 0 1 1
#> 3 개막식 0 1 1 1
#> 4 국민 1 0 1 5
#> 5 따뜻 1 1 2 2
#> 6 불 0 2 2 2
#> 7 사이 1 0 1 3
#> 8 성공 0 1 1 2
#> 9 시킬 0 1 1 1
#> 10 양국 1 0 1 8
#> 11 에 1 0 1 8
#> 12 와 1 0 1 4
#> 13 으로 0 1 1 5
#> 14 은 1 0 1 9
#> 15 을 0 3 3 13
#> 16 을수록 1 0 1 1
#> 17 의 2 3 5 12
#> 18 일 1 0 1 5
#> 19 하 0 1 1 16
#> 20 한 2 0 2 7
#> 21 해 0 1 1 5
#> 22 우정 NA NA 5 5
#> 23 [[TOKENS]] 15 15 30 617
# change span argument
tab_colloc <- collocate(docs, "우정", type = "morpheme")
coll_scores(tab_colloc, "우정", span = 2)
#> Term Before After Span Total T MI
#> 1 , 1 0 1 10 0.6758509 1.6252705
#> 2 같 1 0 1 1 0.9675851 4.9471986
#> 3 개막식 0 1 1 1 0.9675851 4.9471986
#> 4 국민 1 0 1 5 0.8379254 2.6252705
#> 5 따뜻 1 1 2 2 1.3683720 4.9471986
#> 6 불 0 2 2 2 1.3683720 4.9471986
#> 7 사이 1 0 1 3 0.9027553 3.3622361
#> 8 성공 0 1 1 2 0.9351702 3.9471986
#> 9 시킬 0 1 1 1 0.9675851 4.9471986
#> 10 양국 1 0 1 8 0.7406807 1.9471986
#> 11 에 1 0 1 8 0.7406807 1.9471986
#> 12 와 1 0 1 4 0.8703404 2.9471986
#> 13 으로 0 1 1 5 0.8379254 2.6252705
#> 14 은 1 0 1 9 0.7082658 1.7772736
#> 15 을 0 3 3 13 1.4887590 2.8317214
#> 16 을수록 1 0 1 1 0.9675851 4.9471986
#> 17 의 2 3 5 12 2.0621113 3.6841642
#> 18 일 1 0 1 5 0.8379254 2.6252705
#> 19 하 0 1 1 16 0.4813614 0.9471986
#> 20 한 2 0 2 7 1.2537679 3.1398437
#> 21 해 0 1 1 5 0.8379254 2.6252705
#> 22 우정 NA NA 5 5 NA NA
#> 23 [[TOKENS]] 15 15 30 617 NA NA
# change span argument
tab_colloc <- collocate(docs, "우정", type = "morpheme")
coll_scores(tab_colloc, "국민", span = 2)
#> Term Before After Span Total T MI
#> 1 , 1 0 1 10 0.6758509 1.6252705
#> 2 같 1 0 1 1 0.9675851 4.9471986
#> 3 개막식 0 1 1 1 0.9675851 4.9471986
#> 4 국민 1 0 1 5 NA NA
#> 5 따뜻 1 1 2 2 1.3683720 4.9471986
#> 6 불 0 2 2 2 1.3683720 4.9471986
#> 7 사이 1 0 1 3 0.9027553 3.3622361
#> 8 성공 0 1 1 2 0.9351702 3.9471986
#> 9 시킬 0 1 1 1 0.9675851 4.9471986
#> 10 양국 1 0 1 8 0.7406807 1.9471986
#> 11 에 1 0 1 8 0.7406807 1.9471986
#> 12 와 1 0 1 4 0.8703404 2.9471986
#> 13 으로 0 1 1 5 0.8379254 2.6252705
#> 14 은 1 0 1 9 0.7082658 1.7772736
#> 15 을 0 3 3 13 1.4887590 2.8317214
#> 16 을수록 1 0 1 1 0.9675851 4.9471986
#> 17 의 2 3 5 12 2.0621113 3.6841642
#> 18 일 1 0 1 5 0.8379254 2.6252705
#> 19 하 0 1 1 16 0.4813614 0.9471986
#> 20 한 2 0 2 7 1.2537679 3.1398437
#> 21 해 0 1 1 5 0.8379254 2.6252705
#> 22 우정 NA NA 5 5 2.1635860 4.9471986
#> 23 [[TOKENS]] 15 15 30 617 NA NA
# }