챗GPT와 데이터 과학

챗GPT와 디지털 글쓰기

이광춘

비영리법인 한국 R 사용자회

2023년 4월 13일

목차

  1. 문서 공장
  2. 디지털 글쓰기
  3. DT, Agile, DevOps
  4. CLI 데이터 과학 / 출판
  5. 질의응답

서울 R 미트업

웹자보

참여와 연대

  • 서울R미트업 meetup.com: link
    • 23년 4월 서울 R 미트업: link
  • 세계 R 미트업 현황 (Global R Meetup Dashboard): link
  • 한국 R 사용자회 (Korea R User Group): link
  • 한국 R 컨퍼런스 (Korea R Conference): link
  • 유튜브 채널 (Youtube Channel): link
  • 페이스북 그룹 (Facebook Group): link

ChatGPT

챗GPT 란?

거대 언어모형(LLM)

공개형 GPT vs 폐쇄형 GPT

HuggingGPT

백만~1억 사용자

백만, 5천만, 1억 가입자를 가질 때까지 걸린 소요시간

AI를 바라보는 관점

3 대장 + \(\alpha\)

한계(?) 1

문서 공장

문서 공장 (Document Factory)

한국 R 컨퍼런스 - 웹사이트

한국 R 컨퍼런스 - 발표자 템플릿

한국 R 컨퍼런스 - 후원

한국 R 컨퍼런스 - 포스터

디지털 글쓰기

데이터 사이언스

문서출판 Agile과 DevOps




문제점 → DevOps

Single Sourcing → Agile

Single Sourcing Multi-Use: DevOps

그림 1: 데이터 사이언스 출판

복잡성

Quarto

R

파이썬

Quarto: R

Quarto: 파이썬

그림 2: 데이터 사이언스 출판 제작 흐름

파이프 & 필터

DT, Agile, DevOps

디자인 씽킹

graph TD
style A fill:#F5A623,stroke:#F5A623,stroke-width:2px;
style B fill:#EFEFEF,stroke:#000,stroke-width:2px;
style C fill:#EFEFEF,stroke:#000,stroke-width:2px;
style D fill:#EFEFEF,stroke:#000,stroke-width:2px;
style E fill:#EFEFEF,stroke:#000,stroke-width:2px;
style F fill:#EFEFEF,stroke:#000,stroke-width:2px;

A[공감하기] --> B[문제 정의]
B[문제 정의] --> C[해결방법 찾기]
C[해결방법 찾기] --> D[시제품 제작]
D[시제품 제작] --> E[시험평가]
E[시험평가] --> F[반복하기]
F[반복하기] --> B[문제정의]

classDef mainNode fill:#F5A623,stroke:#EFEFEF,stroke-width:2px;
class A mainNode;

애자일 개발

graph TD
style A fill:#F5A623,stroke:#F5A623,stroke-width:1px;
style B fill:#EFEFEF,stroke:#000,stroke-width:1px;
style C fill:#EFEFEF,stroke:#000,stroke-width:1px;
style D fill:#EFEFEF,stroke:#000,stroke-width:1px;
style E fill:#EFEFEF,stroke:#000,stroke-width:1px;


A[Product Backlog] -->|Sprint Planning| B[Sprint Backlog]
B[Sprint Backlog] -->|Daily Scrum| C[Development]
C[Development] -->|Sprint Review| D[Product Increment]
D[Product Increment] -->|Sprint Retrospective| E[Process Improvement]
E[Process Improvement] -->|Backlog Refinement| A[Product Backlog]

classDef mainNode fill:#4DB6AC,stroke:#000,stroke-width:1px;
class A mainNode;
classDef subNode fill:#FFF,stroke:#000,stroke-width:1px;
class B,C,D,E subNode;
classDef arrow stroke:#000,stroke-width:1px;
class B,C,D,E arrow;

데브옵스(DevOps)

graph TD
style A fill:#F5A623,stroke:#F5A623,stroke-width:1px;
style B fill:#EFEFEF,stroke:#000,stroke-width:1px;
style C fill:#EFEFEF,stroke:#000,stroke-width:1px;
style D fill:#EFEFEF,stroke:#000,stroke-width:1px;
style E fill:#EFEFEF,stroke:#000,stroke-width:1px;
style F fill:#EFEFEF,stroke:#000,stroke-width:1px;

A["계획 (Plan)"] -->|Code| B[Code]
B[Code] -->|Build| C[Build]
C[Build] -->|Test| D[Test]
D[Test] -->|Deploy| E[Deploy]
E[Deploy] -->|Operate| F["운영 (Operate)"]
F["운영 (Operate)"] -->|Monitor| A["계획 (Plan)"]

classDef mainNode fill:#4DB6AC,stroke:#000,stroke-width:1px;
class A mainNode;
classDef subNode fill:#FFF,stroke:#000,stroke-width:1px;
class B,C,D,E,F subNode;
classDef arrow stroke:#000,stroke-width:1px;
class B,C,D,E,F arrow;

DT → Agile → DevOps


챗GPT 디지털 글쓰기


쉘 프로그래밍


CLI 데이터 과학 / 출판

CLI → GUI → NLI

출판

                                 저자

graph TB
style A fill:#E3B04B,stroke:#000,stroke-width:1px;
style B fill:#FFF,stroke:#000,stroke-width:1px;
style C fill:#FFF,stroke:#000,stroke-width:1px;
style D fill:#FFF,stroke:#000,stroke-width:1px;
style E fill:#FFF,stroke:#000,stroke-width:1px;
style F fill:#FFF,stroke:#000,stroke-width:1px;

A[완성된 원고] -->|ISBN 부여| B[ISBN 번호 부여]
B[ISBN 번호 부여] -->|책 표지| C[책 표지 제작]
C[책 표지 제작] -->|출판사 번호 부여| D[출판사 번호 적용]
D[출판사 번호 적용] -->|인쇄| E[책 인쇄하기]
E[책 인쇄하기] -->|배포| F[도서 배포]

classDef mainNode fill:#E3B04B,stroke:#000,stroke-width:1px;
class A mainNode;
classDef subNode fill:#FFF,stroke:#000,stroke-width:1px;
class B,C,D,E,F subNode;
classDef arrow stroke:#000,stroke-width:1px;
class B,C,D,E,F arrow;

                             출판사

graph TB
style A fill:#E3B04B,stroke:#000,stroke-width:1px;
style B fill:#FFF,stroke:#000,stroke-width:1px;
style C fill:#FFF,stroke:#000,stroke-width:1px;
style D fill:#FFF,stroke:#000,stroke-width:1px;
style E fill:#FFF,stroke:#000,stroke-width:1px;
style F fill:#FFF,stroke:#000,stroke-width:1px;

A[조사연구] -->|사업계획| B[사업계획 수립]
B[사업계획 수립] -->|법적 구조| C[법적 구조 선택]
C[법적 구조 선택] -->|사업자 출판등록| D[출판 사업자 등록]
D[출판 사업자 등록] -->|ISBN 신청| E[ISBN 신청]
E[ISBN 신청] -->|도서 카탈로그 생성| F[도서 카탈로그 생성]

classDef mainNode fill:#E3B04B,stroke:#000,stroke-width:1px;
class A mainNode;
classDef subNode fill:#FFF,stroke:#000,stroke-width:1px;
class B,C,D,E,F subNode;
classDef arrow stroke:#000,stroke-width:1px;
class B,C,D,E,F arrow;

참고문헌

Martin, T., & Majidian, A. (2011). Beyond the known unknowns-finding fuzzy concepts for creative knowledge discovery. World Conference on Soft Computing, San Francisco.
Shen, Y., Song, K., Tan, X., Li, D., Lu, W., & Zhuang, Y. (2023). HuggingGPT: Solving AI Tasks with ChatGPT and its Friends in HuggingFace. https://arxiv.org/abs/2303.17580
Song, A. K. (2019). The Digital Entrepreneurial Ecosystem—a critique and reconfiguration. Small Business Economics, 53(3), 569–590.
Zhao, W. X., Zhou, K., Li, J., Tang, T., Wang, X., Hou, Y., Min, Y., Zhang, B., Zhang, J., Dong, Z., Du, Y., Yang, C., Chen, Y., Chen, Z., Jiang, J., Ren, R., Li, Y., Tang, X., Liu, Z., … Wen, J.-R. (2023). A Survey of Large Language Models. https://arxiv.org/abs/2303.18223