공동발생 분석을 위한 공동발생 단어 추출 및 해당 단어의 공동발생 빈도 및 문서에서의 발생 빈도 정보 생성

collocate(
  x,
  node,
  span = 3,
  type = c("noun", "noun2", "verb", "adj", "morpheme")
)

Arguments

x

character. 공동발생(co-occurrences) 분석에 사용할 document.

node

character. 공동발생 분석 단어(term)

span

integer. 공동발생 window 단위. 기본값은 3.

type

character. 공동발생에 사용할 단어를 생성하는 방법으로서의 형태소 분석의 결과 유형. 모든 품사, 명사, 동사 및 형용사와 같은 토큰화 결과 유형을 지정. "morpheme", "noun", "noun2", "verb", "adj"중에서 선택. 기본값은 "noun"로 일반명사만 추출함.

Value

data.frame. 공동발생 정보를 담은 data.frame

Examples

# \donttest{
docs <- president_speech$doc[1]

# default arguments
collocate(docs, "우정")
#>          Term Before After Span Total
#> 1        가슴      1     0    1     1
#> 2      개막식      0     1    1     1
#> 3        계기      0     1    1     1
#> 4        국민      1     1    2     5
#> 5        노력      1     0    1     1
#> 6          때      0     1    1     1
#> 7        보람      0     1    1     1
#> 8          불      1     2    3     2
#> 9        사이      1     0    1     3
#> 10       성공      0     1    1     2
#> 11       양국      2     1    3     8
#> 12       우정      1     1    2     5
#> 13       이틀      0     1    1     1
#> 14         일      1     0    1     1
#> 15       자리      1     1    2     3
#> 16       적극      1     0    1     2
#> 17         전      0     1    1     3
#> 18       축하      0     1    1     2
#> 19         해      1     1    2     3
#> 20       우정     NA    NA    5     5
#> 21 [[TOKENS]]     12    15   27   148

# change span argument
collocate(docs, "우정", span = 4)
#>          Term Before After Span Total
#> 1        가슴      2     0    2     1
#> 2      개막식      0     1    1     1
#> 3        계기      0     1    1     1
#> 4        국민      2     1    3     5
#> 5        노력      1     0    1     1
#> 6          때      0     1    1     1
#> 7        보람      0     1    1     1
#> 8          불      2     3    5     2
#> 9        사이      1     1    2     3
#> 10       생각      0     1    1     2
#> 11       성공      0     1    1     2
#> 12       수교      1     0    1     1
#> 13       양국      2     1    3     8
#> 14       우정      1     1    2     5
#> 15       이틀      0     1    1     1
#> 16         일      1     0    1     1
#> 17       자리      1     1    2     3
#> 18       적극      1     0    1     2
#> 19         전      0     1    1     3
#> 20       주최      0     1    1     1
#> 21       축하      0     1    1     2
#> 22         해      1     1    2     3
#> 23       행사      0     1    1     2
#> 24       우정     NA    NA    5     5
#> 25 [[TOKENS]]     16    20   36   148

# change type argument
collocate(docs, "우정", type = "morpheme")
#>          Term Before After Span Total
#> 1           ,      1     0    1    10
#> 2          같      1     0    1     1
#> 3      개막식      0     1    1     1
#> 4        국민      1     0    1     5
#> 5        따뜻      1     1    2     2
#> 6          불      0     2    2     2
#> 7        사이      1     0    1     3
#> 8        성공      0     1    1     2
#> 9        시킬      0     1    1     1
#> 10       양국      1     0    1     8
#> 11         에      1     0    1     8
#> 12         와      1     0    1     4
#> 13       으로      0     1    1     5
#> 14         은      1     0    1     9
#> 15         을      0     3    3    13
#> 16     을수록      1     0    1     1
#> 17         의      2     3    5    12
#> 18         일      1     0    1     5
#> 19         하      0     1    1    16
#> 20         한      2     0    2     7
#> 21         해      0     1    1     5
#> 22       우정     NA    NA    5     5
#> 23 [[TOKENS]]     15    15   30   617
# }