공공데이터 이해, 데이터 활용역량

챗GPT와 데이터 사이언스

이광춘/신종화

비영리법인 한국 R 사용자회

2023년 7월 4일

목차

  1. 강사소개 및 미트업 안내

  2. (디지털) 지표로 보는 대한민국

  3. 공공데이터 현황

  4. 공공데이터 사례: 선거 공공데이터

  5. [광명시] : 어린이 교통사고, 유동인구, 카드사용

  6. 데이터 문해력

  7. (챗GPT) 데이터 과학

  8. 오피스 → 챗GPT 디지털 글쓰기

  9. 질의응답!

강사소개 & 강의 개요

  • 강사소개
  • 강의개요

AI 아바타

주요경력 및 학력

  • (현) 공익법인 한국 R 사용자회: 기술 이사

  • (현) 국가교육위원회 전문위원: 과학/기술 분과

  • (현) 건국대학교 챗GPT 데이터 사이언스 과정: 외래교수

  • (현) 경기도 빅데이터 위원회 자문위원

  • (전) TCS: GS 칼텍스 디지털 아카데미 강사

  • (전) 연세대학교 데이터 사이언스: 겸임교수

  • (전) 삼정 KPMG: Lighthouse AI 기술총괄

  • (전) 웹젠: 데이터 과학자 TD

  • (전) 현대모비스: 차량용 반도체 개발구매

  • (전) 현대자동차: VAATZ / FTA




  • KAIST, CMU, 연세대 응용통계 및 컴퓨터 과학 전공

  • RStudio Instructor - Tidyverse

  • Seoul R Meetup Organizer

강의상세

  • 날짜 : 2023. 7. 04.(월) 16:00~17:30
  • 장소 : 광명시청
  • 대상 : 광명시 소속 공무원
  • 내용
    • “공공데이터”
    • “데이터 역량강화”
    • “데이터 과학”
    • “광명시 어린이 교통사고/유동인구”
    • “사무 자동화/지능화”
    • “챗GPT”
    • “Text-to-X”

4차 산업혁명을 넘어서 …

  • 생각의 진화
  • 인간과 기계의 분업
  • 챗GPT와 글쓰기

(Cummings, 2014)

디지털 뉴딜

디지털 뉴딜, 지역균형 문제 해결과 지역균형 발전방안 (이광춘, 2020)

디지털 전환 지표
ㄴ 전통 지표

전통적 지표



  • 위키백과 OECD

전통 지표 기준 강대국

country
flags
gdp
area
population
gdp_per_capita
United States
🇺🇸
19,391
9,831,510
326
59,532
Japan
🇯🇵
5,487
377,962
127
43,279
Germany
🇩🇪
4,188
357,380
83
50,639
France
🇫🇷
2,876
549,087
67
42,850
United Kingdom
🇬🇧
2,857
243,610
66
43,269
Italy
🇮🇹
2,387
301,340
61
39,427
Mexico
🇲🇽
2,358
1,964,380
129
18,258
Turkey
🇹🇷
2,140
785,350
81
29,505
Korea, South
🇰🇷
1,973
100,280
51
38,335
Spain
🇪🇸
1,770
505,940
47
37,998
1–10 of 36 rows

확장 전통 지표



  • 위키백과 OECD

확장 지표 기준 선진국

country
flags
income_inequality
hdi
fsi
cpi
ief
gpi
wpfi
di
Slovenia
🇸🇮
25.4
0.9
28.0
60.0
67.8
1.4
22.3
7.5
Czech Republic
🇨🇿
25.9
0.9
37.6
56.0
74.8
1.4
24.9
7.7
Slovakia
🇸🇰
26.5
0.9
40.5
50.0
66.8
1.6
23.6
7.2
Finland
🇫🇮
27.1
0.9
16.9
86.0
75.7
1.5
7.9
9.3
Norway
🇳🇴
27.5
1.0
18.0
84.0
73.4
1.5
7.8
9.9
Belgium
🇧🇪
27.7
0.9
28.6
75.0
68.9
1.5
12.1
7.6
Iceland
🇮🇸
27.8
0.9
19.8
78.0
77.1
1.1
14.7
9.6
Denmark
🇩🇰
28.2
0.9
19.5
87.0
78.3
1.3
9.9
9.2
Netherlands
🇳🇱
28.2
0.9
24.8
82.0
77.0
1.5
8.6
9.0
Sweden
🇸🇪
29.2
0.9
20.3
85.0
74.9
1.5
8.3
9.4
1–10 of 36 rows

디지털 전환 지표
ㄴ 디지털 지표

디지털 강대국 지표

  • 디지털 정부 순위
  • 정부 인공지능 준비지수
  • 데이터 경제 순위
  • 산업용 로봇 밀도
  • 세계 경쟁력 보고서
  • IMD 세계 경쟁력 연감

디지털 강대국 지표 - 디지털 정부 순위

country
flags
디지털정부
gdp
gdp_per_capita
Korea, South
🇰🇷
1
1,973
38,335
United Kingdom
🇬🇧
2
2,857
43,269
Colombia
🇨🇴
3
709
14,507
Denmark
🇩🇰
4
296
51,364
Japan
🇯🇵
5
5,487
43,279
Canada
🇨🇦
6
1,714
46,705
Spain
🇪🇸
7
1,770
37,998
Israel
🇮🇱
8
333
38,262
Portugal
🇵🇹
10
326
31,673
France
🇫🇷
11
2,876
42,850
1–10 of 36 rows

디지털 강대국 지표 - 인공지능 준비지수

country
flags
AI_순위
gdp
gdp_per_capita
United States
🇺🇸
1
19,391
59,532
United Kingdom
🇬🇧
2
2,857
43,269
Finland
🇫🇮
3
247
44,866
Germany
🇩🇪
4
4,188
50,639
Sweden
🇸🇪
5
505
50,208
Korea, South
🇰🇷
7
1,973
38,335
Denmark
🇩🇰
8
296
51,364
Netherlands
🇳🇱
9
900
52,503
Norway
🇳🇴
10
324
61,414
France
🇫🇷
11
2,876
42,850
1–10 of 36 rows

디지털 강대국 지표 - 데이터 경제

country
flags
데이터경제
gdp
gdp_per_capita
United States
🇺🇸
1
19,391
59,532
United Kingdom
🇬🇧
2
2,857
43,269
Finland
🇫🇮
​
247
44,866
Germany
🇩🇪
13
4,188
50,639
Sweden
🇸🇪
8
505
50,208
Korea, South
🇰🇷
5
1,973
38,335
Denmark
🇩🇰
​
296
51,364
Netherlands
🇳🇱
​
900
52,503
Norway
🇳🇴
​
324
61,414
France
🇫🇷
6
2,876
42,850
1–10 of 36 rows

디지털 강대국 지표 - 산업용 로봇

country
flags
로봇_순위
gdp
gdp_per_capita
Korea, South
🇰🇷
2
1,973
38,335
Japan
🇯🇵
3
5,487
43,279
Germany
🇩🇪
4
4,188
50,639
Sweden
🇸🇪
5
505
50,208
Denmark
🇩🇰
6
296
51,364
United States
🇺🇸
9
19,391
59,532
Italy
🇮🇹
10
2,387
39,427
Belgium
🇧🇪
11
544
47,840
Netherlands
🇳🇱
12
900
52,503
Spain
🇪🇸
13
1,770
37,998
1–10 of 36 rows

디지털 강대국 지표 - WEF 세계 경쟁력

country
flags
WEF_순위
gdp
gdp_per_capita
United States
🇺🇸
1
19,391
59,532
Netherlands
🇳🇱
3
900
52,503
Switzerland
🇨🇭
4
548
64,712
Japan
🇯🇵
5
5,487
43,279
Germany
🇩🇪
6
4,188
50,639
Sweden
🇸🇪
7
505
50,208
United Kingdom
🇬🇧
8
2,857
43,269
Denmark
🇩🇰
9
296
51,364
Finland
🇫🇮
10
247
44,866
Korea, South
🇰🇷
12
1,973
38,335
1–10 of 36 rows

디지털 강대국 지표 - IMD 디지털 경쟁력

country
flags
IMD_순위
gdp
gdp_per_capita
United States
🇺🇸
1
19,391
59,532
Denmark
🇩🇰
3
296
51,364
Sweden
🇸🇪
4
505
50,208
Switzerland
🇨🇭
6
548
64,712
Netherlands
🇳🇱
7
900
52,503
Korea, South
🇰🇷
8
1,973
38,335
Norway
🇳🇴
9
324
61,414
Finland
🇫🇮
10
247
44,866
Canada
🇨🇦
12
1,714
46,705
United Kingdom
🇬🇧
13
2,857
43,269
1–10 of 36 rows

디지털 강대국 지표 - 종합

country
flags
정부
AI
데이터경제
로봇
WEF
IMD
Korea, South
🇰🇷
1
7
5
2
12
8
Japan
🇯🇵
5
13
11
3
5
27
Germany
🇩🇪
26
4
13
4
6
18
Sweden
🇸🇪
33
5
8
5
7
4
Denmark
🇩🇰
4
8
​
6
9
3
United States
🇺🇸
​
1
1
9
1
1
Italy
🇮🇹
15
25
16
10
29
42
Belgium
🇧🇪
25
29
​
11
21
25
Netherlands
🇳🇱
21
9
​
12
3
7
Spain
🇪🇸
7
24
14
13
22
33
1–10 of 36 rows

디지털 강대국 지표 - 종합 시각화

FranceGermanyItalyJapanKorea, SouthUnited KingdomUnited StatesAustraliaCanadaChileCzech RepublicGreeceHungaryIrelandMexicoNew ZealandPolandPortugalSpainSwedenSwitzerlandTurkey−2−1012−2−1012
30-50 클럽기타umap1umap2
plotly-logomark

공공데이터
현황

공공데이터 포털

지자체_목록
포털명
x2021_7_현황_점검
x2022_04_유지_여부_점검
공공데이터포털
공공데이터포털
o
x
강원도
강원 공공데이터
o
x
경기도
경기데이터드림
o
o
경상남도
경남 빅데이터 허브 플랫폼
o
x
경상북도
경북 공공데이터&통계
o
x
광주광역시
광주광역시 빅데이터 통합플랫폼
o
x
대구광역시
대구 D데이터허브
o
o
대전광역시
x
​
​
부산광역시
부산 공공데이터포털
o
o
서울특별시
서울 열린데이터광장
o
o
1–10 of 18 rows
  • 김학래, “2022 데이터 인사이트 세미나”, 중앙대학교 HIKE 연구실

공공데이터 자료 제공 형식

포털_목록
서비스_유형
공공데이터포털
LINK, LOD, REST, RSS/ATOM,YSOAP,Y다운로드,Y배송 및 기타
강원 공공데이터
LINK,YSHEET,YCHART,YOPENYAPI,YMAP,YFILE
경기데이터드림
FILE,YLINK,YSHEET,YMAP,YCHART,YOPENYAPI
경남 빅데이터 허브 플랫폼
-
경북 공공데이터&통계
파일,YAPI,Y데이터,Y오픈API
광주광역시 빅데이터 통합플랫폼
파일,Y링크
대구 D데이터허브
API,YFILE
부산 공공데이터포털
SHEET,YMAP,YAPI,YFILE,YLINK
서울 열린데이터광장
SHEET,YOpenAPI,YFILE,YCHART,YLINK
울산광역시 데이터포털
-
1–10 of 16 rows
  • 김학래, “2022 데이터 인사이트 세미나”, 중앙대학교 HIKE 연구실

공공데이터 정해진 미래(?)

  • 김학래, “2022 데이터 인사이트 세미나”, 중앙대학교 HIKE 연구실

선거 공공데이터

오픈 데이터 포럼

선거관련 데이터 및 사법기관의 공공데이터 개방현황과 개선방안

2022년 7월 열린세미나를 개최합니다. 이번 주제는 선거관련 데이터의 개방현황과 사법기관 공공데이터의 개방현황 그리고 개선방안을 함께 살펴보는 시간을 준비했습니다 관심있는 분들의 많은 참여와 의견 바랍니다.

  • 일시: 2022. 7. 28.(목) 14~17시

  • 참여방법:

    1. 서울창업허브(서울특별시 마포구 공덕동 백범로31길 21) 본관 10층 대강당
    2. 웹세미나 (유튜브/오픈데이터포럼 공식채널)
  • 주제: 선거관련 데이터 및 사법기관의 공공데이터 개방현황과 개선방안

  • 참가신청 : https://www.onoffmix.com/event/259343

  • 온·오프라인 사전 신청자에 한에서 이벤트를 통해 소정의 기념품 을 준비했으므로, 많은 관심과 참여 부탁드리겠습니다

주요 선거 일정




중앙선관위 데이터 제공방식

  • 중앙선관위: 웹사이트
  • 중앙선관위 - 자료실
  • 공공데이터포털 - API

중앙선관위 제공 데이터

  • 투/개표
  • 여론조사
  • 의식조사
  • 정당회계
  • TV토론
  • 지도
  • 정책공약
  • 공보물

  • 선거통계시스템

  • 중앙선거여론조사심의위원회

  • 제20대 대통령선거 유권자의식조사, PDF

  • 2020년도 정당의 활동개황 및 회계보고, PDF

  • 제 20대 대통령선거 후보자 토론회 다시보기

  • 선거구지도 - 대한민국 행정동 경계(admdongkor)

  • 정책공약마당

  • 선거정보도서관-후보자선전물

데이터 사이언스 사례

  • 사전투표율
  • 역대선거
  • 여론조사
  • TV 토론
  • 지도
  • 공약
  • 정당사무소

  • 제20대 대통령 선거, 사전투표 역사를 새로 쓰다

  • 지방선거 시도지사 절반, 5월 12일 결정된다

  • 여론조사를 네 분류로 나눠보니, 눈에 띄는 흐름

  • 데이터를 통해 본 대선 TV 토론회

  • 대선득표율로 지방선거 판세를 가늠해보자

  • 유력 대선후보 4인, 10대 공약 중 압도적 분야는 ‘00’

  • 양강 구도 속 부지런히 움직이는 제3후보는?

krvote 데이터 패키지

  • 패키지
  • 데이터 패키지
  • 전처리작업
  • 후처리작업
  • krvote

  • Desirée De Leon, Alison Hill, “A Handbook for Teaching and Learning with R and RStudio”, 2019-09-11

  • Desirée De Leon, Alison Hill, “A Handbook for Teaching and Learning with R and RStudio”, 2019-09-11

  • 이광춘, “krvote - 대한민국 선거 데이터 패키지”, 2022-06-09

  • 이광춘, “krvote - 대한민국 선거 데이터 패키지”, 2022-06-09
데이터셋
데이터설명
by_election_2021
서울, 부산 시장 재보궐선거
casting_votes
선거별 구시군별 투표수
chongun_winner
​
code_election
중앙선거관리위원회 선거코드
code_gusigun
중앙선거관리위원회 구시군코드 공공데이터포털 - 중앙선거관리위원회 구시군코드 검색어: 중앙선거관리위원회 코드정보
code_party
중앙선거관리위원회 정당코드
code_precinct
중앙선거관리위원회 선거구 코드
1–7 of 40 rows

제20대 대통령 선거

어린이 교통사고
광명시

보도자료

  • 2019-11-19 ‘민식이법’ 빨리 통과되기를” 엄마 눈물의 호소에…

초등학교 주변 CCTV 현황

15
8
9
11
15
8
28
9
18
17
15
8
2
15
8
2
+−
Leaflet | © OpenStreetMap contributors

제작방법: 경기도 광명시 - 학교와 CCTV

어린이 교통사고 통계

  • 사고유형별 어린이 사망
  • 교통사고건수 추세
광명시 보행 어린이 교통사고
TAAS 교통사고분석시스템 (2014~2022)
사고유형 교통사고 어린이 구분 합계
사망자수 중상자수 경상자수
차대사람 - 기타 0 11 34 45
차대사람 - 길가장자리구역통행중 0 3 12 15
차대사람 - 보도통행중 0 2 5 7
차대사람 - 차도통행중 0 3 8 11
차대사람 - 횡단중 3 33 59 95
차대차 - 기타 0 1 2 3
차대차 - 측면충돌 0 3 0 3
합계 3 56 120 179

광명시 유동인구(KT)

데이터출처: 경기도 데이터 분석센터 KT 유동인구 (2018년 1월 ~ 2022년 12월)

광명시 카드사용금액(BC) → 작업중

데이터출처: 경기도 데이터 분석센터 BC카드 사용내역 (2018년 1월 ~ 2022년 12월)

데이터 문해력이라고 쓰고
데이터 활용역량이라고 읽는다.

러시아 월드컵 (독일전)


러시아 월드컵(2018) - 한국 vs 독일

1854년 런던 코로나19

  • 팬데믹
  • 데이터-1
  • 데이터-2
  • 탐정
  • 시각화(1854)
  • 시각화(2022)
  • 메타버스

사망자 번호
경도
위도
1
13.58801
11.0956
2
9.878124
12.55918
3
14.65398
10.18044
4
15.22057
9.993003
5
13.16265
12.96319
6
13.80617
8.889046
7
13.10214
10.56081
1–7 of 578 rows
...

  • 1854 Broad Street cholera outbreak

지진해일 대피소

xwMOOC (2018-01-17), “지진해일 대피소 - crosstalk”

손씻기 역사

  • 출생사망
  • 데이터
  • 병원별 비교
  • 시간별 비교
  • 사망율 분포
  • 통계검정

연도별

year births deaths clinic
1841 3,036 237 clinic 1
1842 3,287 518 clinic 1
1843 3,060 274 clinic 1
1844 3,157 260 clinic 1
1845 3,492 241 clinic 1
1846 4,010 459 clinic 1
1841 2,442 86 clinic 2
1842 2,659 202 clinic 2
1843 2,739 164 clinic 2
1844 2,956 68 clinic 2
1845 3,241 66 clinic 2
1846 3,754 105 clinic 2

월별

연도
출생
사망
1841-01-01
254
37
1841-02-01
239
18
1841-03-01
277
12
1841-04-01
255
4
1841-05-01
255
2
1–5 of 98 rows
...



statistic p.value parameter conf.low conf.high method alternative
-9.610071 0 92.43544 -0.1013066 -0.0666066 Welch Two Sample t-test two.sided
  • 이광춘, “손씻기 그리고 통계 - 제멜바이스”

정규분포

  • 골턴 보드
  • 동영상
  • 모의실험
  • 실제사례 - 신장
  • 미국 대학생 신장

  • 육군 신체측정정보 : 육군 신체측정 데이터(수시 업데이터)

나폴레옹 러시아 침공

  • 나폴레옹
  • 미나르 지도
  • 실제 침공
  • 데이터
  • 시각화

생존병사 수

위도
경도
생존병사수
진격방향
24
54.9
340,000
A
24.5
55
340,000
A
25.5
54.5
340,000
A
26
54.7
320,000
A
27
54.8
300,000
A
1–5 of 51 rows
...

후퇴 기온

위도
기온
후퇴날짜
관측날짜
37.6
0
6
Oct18
36
0
6
Oct24
33.2
-9
16
Nov09
32
-21
5
Nov14
29.2
-11
10
​
1–5 of 9 rows

Re-Visions of Minard

나이팅게일 - 백의천사

  • 나이팅게일
  • 크림전쟁
  • 데이터
  • 시각화

일자
군인수
질병사망
부상사망
기타사망
질병사망율
부상사망율
기타사망율
1854-04-01
8,571
1
0
5
1.4%
0%
7%
1854-05-01
23,333
12
0
9
6.2%
0%
4.6%
1854-06-01
28,333
11
0
6
4.7%
0%
2.5%
1854-07-01
28,722
359
0
23
150%
0%
9.6%
1854-08-01
30,246
828
1
30
328.5%
0.4%
11.9%
1–5 of 24 rows

  • 위키백과, “플로렌스 나이팅게일”
  • 위키백과, “크림전쟁”

회귀분석 - MLB 투수 유전자는 유전이 될까?

회귀분석 - MLB 투수 유전자는 유전이 될까?

폭격비행기

  • 세계대전 - 유럽
  • 세계대전 - 태평양
  • 대공포
  • 폭격기 데이터
  • 고민
  • 업그레이드

데이터 과학

데이터 과학

데이터 사이언스(Data Science)는 데이터를 다루는 과학이다. 따라서 자연법칙을 다루는 자연과학과 맥이 닿아있다. 자연법칙을 측정하여 데이터프레임(DataFrame)으로 나타내면 변수(Variable), 관측점(Observation), 값(Value)으로 표현된다.

데이터 과학 (넓은 의미)

데이터 과학 욕구단계설

  • 매슬로 욕구단계설
  • 가치 피라미드

가치

  • 기술 분석(Descriptive Analytics): 무슨 일이 있었나? (What happened?)
  • 진단 분석(Diagnostic Analytics): 왜 일어났나? (Why did it happen?)
  • 예측 분석(Predictive Analytics): 무슨 일이 일어날까? (What will happen?)
  • 처방 분석(Prescriptive Analytics): 어떻게 그런 일을 일으킬까? (How can we make it happen?)

30년의 변화를 그림으로 표현

이광춘(2019-01-26), “Data Scientist 가 바라본 제조업의 발전 전략 및 방안”, Intree 4.0 World Forum

데이터 경제와 산업

데이터 자원

파이프라인

이광춘 (2020-07-21), “기업운영혁신을 위한 데이터 과학: 기업의 활용방안”, 포항산업과학연구원(RIST)

AI/ML/DL 그리고 데이터 과학


한국통계학회 소식지 2019년 10월호 (이광춘, 2019)

tidyverse

  • 기존 자료구조를 재사용
  • 파이프 연산자로 간단한 함수를 조합
  • 함수형 프로그래밍을 적극 사용
  • 기계가 아닌 인간을 위한 설계
  • Reuse existing data structures.
  • Compose simple functions with the pipe.
  • Embrace functional programming.
  • Design for humans.

엑셀 선 넘네!!!

  • 세미나
  • 엑셀 구성
  • 엑셀 참사
  • 복잡성
  • 6가지 이유
  • 엑셀 → 챗GPT

  • 스프레드쉬트는 데이터, 서식, 수식으로 구성된다.
  • 숫자 데이터를 엑셀로 가져오게 되면 엑셀 내장 함수를 통해 수식 계산을 수행한다.
  • 엑셀 사용자 본인 혹은 외부 사람을 위해 서식을 입히는 과정을 거쳐 비로소 완성된 스프레드쉬트가 된다.

회사 손실 날짜 영향 참사 개요
Mouchel £ 4.3백만 ’10.11월 CEO 사임, 주가폭락 연금펀드평가 £ 4.3백만 엑셀 오류
C&C Group £ 9 백만 ’09.7월 주가 15% 하락 등 매출 3% 상승이 아니고 5% 하락, 엑셀 오류
King 펀드 £ 130 백만 ’11.05월 브래드 이미지 하락 웨일즈 지방 NHS 지출 엑셀 오류
AXA Rosenberg £ 150 백만 ’11.02월 은폐, 벌금, 브래드 이미지 하락 엑셀 오류를 감춰서 $242 백만 벌금
JP Morgan Chase £ 250 백만 ’13.01월 명성, 고객 신뢰도 저하 바젤 II VaR 위험 평가 엑셀 오류
Magellan 펀드 £ 1.6 십억 ’95.01월 투자자에게 약속한 배당금 지급 못함 음수 부호 누락으로 자본이득 과대계상
미연방준비위원회 £ 2.5 십억 ’10.10월 명확하지 않음 리볼빙 카드 신용액 산출 과정에 엑셀 오류




스프레드쉬트 사용 이유

  • 항상 엑셀을 사용했다: 항상 데이터를 엑셀로 저장하고 분석해서 사용했다. 하지만, 버튼 하나로 데이터를 내보내기 쉽다.
  • 데이터베이스를 사용할 만큼 데이터가 충분하지 않다: 데이터가 작아서 데이터베이스를 사용할 이유를 찾지 못하지만, 사업이 커지고, 업무량이 늘어나면서 엑셀 작업량이 높아지고, 복잡성도 커지고, 엑셀 자체에서 처리되는 시간도 늘어난다.

엑셀 → 다른 도구

  1. 한번에 한사람만 작업이 가능하다.
  2. 데이터 감사는 데이터베이스에서만 가능
  3. 데이터베이스는 정형화된 작업흐름을 지원한다.
  4. 데이터베이스는 엑셀보다 모형을 보다 잘 지원한다.
  5. 데이터베이스로 보고서 생성이 수월하다.
  6. 데이터베이스는 보안이 강력하고 규제하기 좋다.

  1. R은 시각화와 통계 데이터 전처리에 좋다.
  2. 파이썬은 AI 기능 도입에 좋다.
  3. Git/GitHub 은 재현성과 버젼제어에 좋다.

스터디 뽀개기 7월 (2016-07-30), 분석행(Train to data-analysis), 탈옥(jailbreakr) – 엑셀에서 탈출… 자유, “위기의 스프레드쉬트”, THE DIRTY DOZEN 12 MODELLING HORROR STORIES & SPREADSHEET DISASTERS

openAI 마이크로소프트 3 대장 + α

chatGPT 3대장

  • 최강 3대장
  • chatGPT 3대장
  • —
  • 글쓰기
  • 그리기
  • 코딩

chatGPT 3대장 + α 추론

  • 문제
  • 수식
  • 손 풀기
  • Sympy
  • chatGPT
  • Wolfram Plugin

디오판토스 묘비

신의 축복으로 태어난 그는 인생의 16을 소년으로 보냈다. 그리고 다시 인생의 112 이 지난 뒤에는 얼굴에 수염이 자라기 시작했다. 다시 17이 지난 뒤 그는 아름다운 여인을 맞이하여 화촉을 밝혔으며, 결혼한 지 5년 만에 귀한 아들을 얻었다. 아! 그러나 그의 가엾은 아들은 아버지의 반 밖에 살지 못했다. 아들을 먼저 보내고 깊은 슬픔에 빠진 그는 그 뒤 4년간 정수론에 몰입하여 스스로를 달래다가 일생을 마쳤다. [^1]

디오판토스가 정확히 언제 태어나고 언제 죽었는지는 명확하지 않지만, 그가 죽었을 때의 나이는 정확히 알 수 있다. 이를 방정식을 통해 풀어보자. 수식을 x에 대해 정리해서 풀면 84가 나온다.

x6+x12+x7+5+x2+4=x

from sympy import *
x = Symbol('x')
Diophantus_puzzle = x/6 + x/12 + x/7 + 5 + x/2 + 4 - x
solve(Diophantus_puzzle, x, dict = True)
[{x: 84}]

울프람 웹사이트

AutoGPT: Text-to-Task


Video Player is loading.
Current Time 0:00
/
Duration -:-
Loaded: 0%
Stream Type LIVE
Remaining Time -0:00
 
1x
    • Chapters
    • descriptions off, selected
    • subtitles settings, opens subtitles settings dialog
    • subtitles off, selected

      This is a modal window.

      Beginning of dialog window. Escape will cancel and close the window.

      Text
      Background
      Window
      Font Size
      Text Edge Style
      Font Family

      End of dialog window.

      • Auto-GPT: An Autonomous GPT-4 Experiment

      데이터 분석: Text-to-Analytics

      • PandasAI
      • LlamaIndex
      • 챗GPT SQL
      • RTutor.ai

      Pandas AI는 널리 사용되는 데이터 분석 및 조작 도구인 Pandas에 생성 인공 지능 기능을 추가한 Python 라이브러리다. Pandas AI는 판다스와 함께 사용하도록 설계되었으며, 판다스를 대체할 수 없다.



      • chatGPT: 판다스 AI

      • chatGPT: 펭귄 - 라마인덱스

      • chatGPT: 챗GPT SQL
      Video Player is loading.
      Current Time 0:00
      /
      Duration 0:00
      Loaded: 0%
      Stream Type LIVE
      Remaining Time -0:00
       
      1x
        • Chapters
        • descriptions off, selected
        • captions and subtitles off, selected

          This is a modal window.

          No compatible source was found for this media.

          Beginning of dialog window. Escape will cancel and close the window.

          Text
          Background
          Window
          Font Size
          Text Edge Style
          Font Family

          End of dialog window.

          • Chat with your data with RTutor
          • RTutor

          챗GPT 인터페이스
          오피스 전쟁

          구글 검색의 종말(?)

          글쓰기 역사


          • 문자와 종이 역사

          오피스 전쟁

          항목 MS 오피스 1 구글 오피스 2 리브레 오피스 3 한컴 오피스 4
          문서 작성 및 편집 워드, 엑셀, 파워포인트 등의 데스크톱 및 웹 앱 제공 구글 문서, 스프레드시트, 프레젠테이션 등의 웹 앱 제공 라이터, 캘크, 임프레스 등의 데스크톱 앱 제공 한글, 한셀, 한쇼 등의 데스크톱 및 모바일 앱 제공
          협업 및 공유 원드라이브를 통해 문서를 클라우드에 저장하고 공유 가능. 여러 사람이 동시에 문서를 수정할 수 있으나 실시간으로 보기 어려움 구글 드라이브를 통해 문서를 클라우드에 저장하고 공유 가능. 여러 사람이 동시에 문서를 수정하고 실시간으로 확인 가능 드롭박스나 구글 드라이브와 연동하여 문서를 클라우드에 저장하고 공유 가능. 여러 사람이 동시에 문서를 수정할 수 있으나 실시간으로 보기 어려움 넷프리즘을 통해 문서를 클라우드에 저장하고 공유 가능. 여러 사람이 동시에 문서를 수정할 수 있으나 실시간으로 보기 어려움
          이메일 및 채팅 Outlook을 통해 비즈니스 메일 제공. Teams을 통해 채팅 및 화상 회의 가능 Gmail을 통해 비즈니스 메일 제공. Chat과 Meet을 통해 채팅 및 화상 회의 가능 이메일 및 채팅 기능 없음 이메일 및 채팅 기능 없음
          가격 1인당 월 5~20달러 다양한 요금제 제공. 데스크톱 앱 사용 가능한 요금제는 12.5달러부터 시작 1인당 월 6~18달러까지 다양한 요금제 제공 완전 무료 개인용은 무료로 사용 가능하며 업무용은 별도로 견적 요청 필요
          1. https://www.microsoft.com/ko-kr/microsoft-365/business

          2. https://workspace.google.com/intl/ko_kr/

          3. https://www.libreoffice.org/

          4. https://www.hancom.com/product/productMain.do

          오피스 전쟁: 패러다임 충돌

          챗GPT 시대 사무실

          • 챗GPT 사용원인
          • 인터페이스
          • 챗GPT AS-IS
          • 챗GPT TO-BE

          챗GPT가 이룬 대통합

          인터페이스 (Interface)

          • 진화과정
          • CLI
          • GUI
          • WUI
          • MUI
          • LUI




          사용자 인터페이스
          GUI
          Graphic User Inferface
          1970~
          CLI
          Command Line Interface
          1950~
          Web Interface
          1994~
          Mobile Interface
          2007~
          LUI
          Language User Interface
          2023~


          • https://en.wikipedia.org/wiki/Computer_terminal


          • https://kartsci.org/kocomu/computer-history/graphical-user-interface-history/



          • https://www.huffpost.com/entry/uber-your-way-through-cit_b_1205446

          • https://twitter.com/sama/status/1515764302904377344

          챗GPT NUI

          • 1:1 채팅
          • 클릭하여 완료
          • 자동완성
          • 명령 팔레트
          • 챗GPT (ChatGPT)

          • OpenAI Playground

          • GitHub Copilot

          • https://towardsdatascience.com/some-experiments-using-github-copilot-with-python-90f8065fb72e

          사례

          Video Player is loading.
          Current Time 0:00
          /
          Duration -:-
          Loaded: 0%
          Stream Type LIVE
          Remaining Time -0:00
           
          1x
            • Chapters
            • descriptions off, selected
            • subtitles settings, opens subtitles settings dialog
            • subtitles off, selected

              This is a modal window.

              Beginning of dialog window. Escape will cancel and close the window.

              Text
              Background
              Window
              Font Size
              Text Edge Style
              Font Family

              End of dialog window.

              • https://blog.replit.com/clui
              • https://blog.replit.com/ai

              Command Palette 역사

              • 60년대로 거슬러 올라가는 명령 팔레트는 최근 기술 업계에서 다시 인기를 얻고 있으며 사용자 중심 소프트웨어의 필수적인 부분으로 간주됨.
              • CLI는 개인용 컴퓨터가 대중화되기 전 초기 컴퓨팅을 지배했으며 사용자가 시스템을 작동하기 위해 특정 명령을 알아야 했다. 1984년 Apple의 매킨토시와 함께 도입된 그래픽 사용자 인터페이스(GUI)는 중요한 혁신으로 여겨졌지만, 소프트웨어의 복잡성이 증가함에 따라 GUI만으로는 탐색하기가 점점 더 어려워졌다.
              • 사용자가 항목 이름의 짧은 약어입력하여 앱과 파일을 검색할 수 있는 런처가 점점 더 보편화 되었다. 예를 들어 2001년에 출시된 Mac OS X용 LaunchBar, Quicksilver, 2005년에 출시된 Apple의 시스템 전체 Spotlight가 있다. 검색과 CLI의 결합은 Command Palette의 탄생으로 이어졌다.
              • 오늘날 우리가 알고 있는 현대식 명령 팔레트는 2011년 Sublime Text 2 베타 Joe Skinner가 처음 소개. 명령줄 사용에 익숙한 프로그래머들이 단축키를 모두 외울 필요 없이 더 빠르게 작업할 수 있어 중요한 발전이 됨.

              도구(문서)의 인간

              글쓰기(문서 제작) 현재와 미래

              현재


              미래


              문서제작 → 글쓰기 기본기

              • 데이터 과학
              • 문서 복잡성
              • 문서 패러다임

              (행정) 글쓰기 진화

              • 글쓰기 역사
              • 도구의 진화
              • 행정 글쓰기
              • 챗GPT 디지털 글쓰기

              경기도 평생학습포털(GSEEK) 챗GPT 디지털 글쓰기

              문서화 프로그래밍

              • 개발과 저작
              • 출판 워크샵
              • 챗GPT 유닉스 쉘
              • →
              • 출판사



              문서
              패키지
              텍스트
              제품(문서)
              배포
              서비스
              (출판)
              소프트웨어
              패키지
              소스코드
              제품(S/W)
              배포
              서비스
              (앱)

              • 워크샵: https://event-us.kr/data-science/event/64397, 소스코드: https://github.com/bit2r/gpt-shell

              참고문헌

              Cummings, M. M. (2014). Man versus machine or man+ machine? IEEE Intelligent Systems, 29(5), 62–69.
              이광춘. (2019). 데이터 사이언스 운영체제 - tidyverse. 한국통계학회 소식지, 10월호, 20–24.
              이광춘. (2020). 디지털 뉴딜, 지역균형 문제 해결과 지역균형 발전방안. 지방자치이슈와 포럼, 33, 88–101.

              한국 R 사용자회 chatGPT. theme insper 소스코드 GitHub.

              1 / 78
              공공데이터 이해, 데이터 활용역량 챗GPT와 데이터 사이언스 이광춘/신종화 비영리법인 한국 R 사용자회 2023년 7월 4일

              1. Slides

              2. Tools

              3. Close
              • 공공데이터 이해, 데이터 활용역량
              • 목차
              • 강사소개 & 강의 개요
              • 4차 산업혁명을 넘어서 …
              • 디지털 뉴딜
              • 디지털 전환 지표 ㄴ 전통 지표
              • 전통적 지표
              • 전통 지표 기준 강대국
              • 확장 전통 지표
              • 확장 지표 기준 선진국
              • 디지털 전환 지표 ㄴ 디지털 지표
              • 디지털 강대국 지표
              • 디지털 강대국 지표 - 디지털 정부 순위
              • 디지털 강대국 지표 - 인공지능 준비지수
              • 디지털 강대국 지표 - 데이터 경제
              • 디지털 강대국 지표 - 산업용 로봇
              • 디지털 강대국 지표 - WEF 세계 경쟁력
              • 디지털 강대국 지표 - IMD 디지털 경쟁력
              • 디지털 강대국 지표 - 종합
              • 디지털 강대국 지표 - 종합 시각화
              • 공공데이터 현황
              • 공공데이터 포털
              • 공공데이터 자료 제공 형식
              • 공공데이터 정해진 미래(?)
              • 선거 공공데이터
              • 오픈 데이터 포럼
              • 주요 선거 일정
              • 중앙선관위 데이터 제공방식
              • 중앙선관위 제공 데이터
              • 데이터 사이언스 사례
              • krvote 데이터 패키지
              • 제20대 대통령 선거...
              • 어린이 교통사고 광명시
              • 보도자료
              • 초등학교 주변 CCTV 현황
              • 어린이 교통사고 통계
              • 광명시 유동인구(KT)
              • 광명시 카드사용금액(BC) → 작업중
              • 데이터 문해력이라고 쓰고 데이터 활용역량이라고 읽는다.
              • 러시아 월드컵 (독일전)
              • 1854년 런던 코로나19
              • 지진해일 대피소
              • 손씻기 역사
              • 정규분포
              • 나폴레옹 러시아 침공
              • 나이팅게일 - 백의천사
              • 회귀분석 - MLB 투수 유전자는 유전이 될까?
              • 폭격비행기
              • 데이터 과학
              • 데이터 과학
              • 데이터 과학 (넓은 의미)
              • 데이터 과학 욕구단계설
              • 가치
              • 30년의 변화를 그림으로 표현
              • 데이터 경제와 산업
              • AI/ML/DL 그리고 데이터 과학
              • tidyverse
              • 엑셀 선 넘네!!!
              • openAI 마이크로소프트 3 대장 + \(\alpha\)
              • chatGPT 3대장
              • chatGPT 3대장 + \(\alpha\) 추론
              • AutoGPT: Text-to-Task
              • 데이터 분석: Text-to-Analytics
              • 챗GPT 인터페이스 오피스 전쟁
              • 구글 검색의 종말(?)
              • 글쓰기 역사
              • 오피스 전쟁
              • 오피스 전쟁: 패러다임 충돌
              • 챗GPT 시대 사무실
              • 챗GPT가 이룬 대통합
              • 인터페이스 (Interface)
              • 챗GPT NUI
              • 도구(문서)의 인간
              • 글쓰기(문서 제작) 현재와 미래
              • 문서제작 → 글쓰기 기본기
              • (행정) 글쓰기 진화
              • 문서화 프로그래밍
              • 참고문헌
              • f Fullscreen
              • s Speaker View
              • o Slide Overview
              • e PDF Export Mode
              • ? Keyboard Help