공동발생 분석을 위한 공동발생 단어에 대한 t-score, MI(mutual information)-score 계산

coll_scores(x, node, span = 3)

Arguments

x

data.frame. "collocate()"를 수행한 공동발생(co-occurrences) 분석결과

node

character. 공동발생 분석 단어(term)

span

integer. 공동발생 window 단위. 기본값은 3.

Value

data.frame. 공동발생 정보와 T-score, MI-score를 담은 data.frame

Examples

# \donttest{
docs <- president_speech$doc[1]

# default arguments
collocate(docs, "우정", type = "morpheme")
#>          Term Before After Span Total
#> 1           ,      1     0    1    10
#> 2          같      1     0    1     1
#> 3      개막식      0     1    1     1
#> 4        국민      1     0    1     5
#> 5        따뜻      1     1    2     2
#> 6          불      0     2    2     2
#> 7        사이      1     0    1     3
#> 8        성공      0     1    1     2
#> 9        시킬      0     1    1     1
#> 10       양국      1     0    1     8
#> 11         에      1     0    1     8
#> 12         와      1     0    1     4
#> 13       으로      0     1    1     5
#> 14         은      1     0    1     9
#> 15         을      0     3    3    13
#> 16     을수록      1     0    1     1
#> 17         의      2     3    5    12
#> 18         일      1     0    1     5
#> 19         하      0     1    1    16
#> 20         한      2     0    2     7
#> 21         해      0     1    1     5
#> 22       우정     NA    NA    5     5
#> 23 [[TOKENS]]     15    15   30   617

# change span argument
tab_colloc <- collocate(docs, "우정", type = "morpheme") 
coll_scores(tab_colloc, "우정", span = 2)
#>          Term Before After Span Total         T        MI
#> 1           ,      1     0    1    10 0.6758509 1.6252705
#> 2          같      1     0    1     1 0.9675851 4.9471986
#> 3      개막식      0     1    1     1 0.9675851 4.9471986
#> 4        국민      1     0    1     5 0.8379254 2.6252705
#> 5        따뜻      1     1    2     2 1.3683720 4.9471986
#> 6          불      0     2    2     2 1.3683720 4.9471986
#> 7        사이      1     0    1     3 0.9027553 3.3622361
#> 8        성공      0     1    1     2 0.9351702 3.9471986
#> 9        시킬      0     1    1     1 0.9675851 4.9471986
#> 10       양국      1     0    1     8 0.7406807 1.9471986
#> 11         에      1     0    1     8 0.7406807 1.9471986
#> 12         와      1     0    1     4 0.8703404 2.9471986
#> 13       으로      0     1    1     5 0.8379254 2.6252705
#> 14         은      1     0    1     9 0.7082658 1.7772736
#> 15         을      0     3    3    13 1.4887590 2.8317214
#> 16     을수록      1     0    1     1 0.9675851 4.9471986
#> 17         의      2     3    5    12 2.0621113 3.6841642
#> 18         일      1     0    1     5 0.8379254 2.6252705
#> 19         하      0     1    1    16 0.4813614 0.9471986
#> 20         한      2     0    2     7 1.2537679 3.1398437
#> 21         해      0     1    1     5 0.8379254 2.6252705
#> 22       우정     NA    NA    5     5        NA        NA
#> 23 [[TOKENS]]     15    15   30   617        NA        NA

# change span argument
tab_colloc <- collocate(docs, "우정", type = "morpheme") 
coll_scores(tab_colloc, "국민", span = 2)
#>          Term Before After Span Total         T        MI
#> 1           ,      1     0    1    10 0.6758509 1.6252705
#> 2          같      1     0    1     1 0.9675851 4.9471986
#> 3      개막식      0     1    1     1 0.9675851 4.9471986
#> 4        국민      1     0    1     5        NA        NA
#> 5        따뜻      1     1    2     2 1.3683720 4.9471986
#> 6          불      0     2    2     2 1.3683720 4.9471986
#> 7        사이      1     0    1     3 0.9027553 3.3622361
#> 8        성공      0     1    1     2 0.9351702 3.9471986
#> 9        시킬      0     1    1     1 0.9675851 4.9471986
#> 10       양국      1     0    1     8 0.7406807 1.9471986
#> 11         에      1     0    1     8 0.7406807 1.9471986
#> 12         와      1     0    1     4 0.8703404 2.9471986
#> 13       으로      0     1    1     5 0.8379254 2.6252705
#> 14         은      1     0    1     9 0.7082658 1.7772736
#> 15         을      0     3    3    13 1.4887590 2.8317214
#> 16     을수록      1     0    1     1 0.9675851 4.9471986
#> 17         의      2     3    5    12 2.0621113 3.6841642
#> 18         일      1     0    1     5 0.8379254 2.6252705
#> 19         하      0     1    1    16 0.4813614 0.9471986
#> 20         한      2     0    2     7 1.2537679 3.1398437
#> 21         해      0     1    1     5 0.8379254 2.6252705
#> 22       우정     NA    NA    5     5 2.1635860 4.9471986
#> 23 [[TOKENS]]     15    15   30   617        NA        NA
# }