Introduce bitNLP
Introduce.Rmd
bitNLP
bitNLP는 텍스트 데이터의 자연어 처리(NLP, Natural Language Processing), 텍스트 분석 모델 및 텍스트 분석을 위한 시각화와 도구 모음입니다.
기능
텍스트 데이터 전처리 기능
- 정규표현식 기반의 텍스트 데이터 조작으로 데이터를 정제함
- 문서 단위의 전처리
- 문서 필터링 (Filter Documents)
- 텍스트 단위의 전처리
- 텍스트 대체 (Replace Texts)
- 텍스트 연결 (Concatenate Texts)
- 텍스트 분리 (Split Texts)
- 텍스트 제거 (Remove Texts)
- 문서 단위의 전처리
- 띄어쓰기 보정
- 토큰화
- N-Grams 토큰화 (Extracting N-Grams)
- 품사 기반의 토큰화
텍스트 데이터 탐색 기능
텍스트 데이터를 탐색하여, 분석의 실마리를 찾거나 정제하는 기능의 Shiny 앱 제공
- 데이터 탐색
- 패턴 검색
- 데이터 정제
- 패턴 검색 및 치환
- 키워드 검색과 맥락 파악
- N-Grams 토큰화 (Extracting N-Grams)
- 품사 기반의 토큰화 (Extracting Nouns)
- 키워드 검색과 공동발현 분석
- Collocation Analysis
- Vignettes
감성분석
- KOSAC(Korean Sentiment Analysis Corpus) 기반의 감성분석
- 긍정/부정 극성 도출
- Positive/Negative
- 감성확률 도출
- 복합 (Complex)
- 부정 (Negative)
- 긍정 (Positive)
- 중립 (Neutral)
- 해당없음 (None)
- 주관성(subjectivity) 도출
- 긍정/부정 극성 도출