chatGPT

경기도 직무교육(4/26~28)

저자
소속
공개

2023년 4월 26일

flowchart LR
   subgraph 주 강의범위
    A[강의 PPT] --> AB["글쓰기<br>(write)"] --> B[실습: <br> 개회사 등]
    A[강의 PPT] --> AC["그리기<br>(draw)"] --> C[그리기: <br> 이미지 작성자 등]
    A[강의 PPT] --> AD["코딩<br>(code)"] --> D[실습: <br> 엑셀 등]
    end
    subgraph 부 강의범위
    A[강의 PPT] -.-> AE["추론<br>(code)"] -.-> E[실습: <br> 수능 등]
    end
    B --> F["심화(선택)"]
    C --> F["심화(선택)"]
    D --> F["심화(선택)"]
    E -.-> F["심화(선택)"]

click A href "https://r2bit.com/bitSlide/slideshow/202304-gpt/#/title-slide"
click AB href "https://r2bit.com/chatGPT/prompt_in_practice.html"
click F href "https://r2bit.com/chatGPT/"

class A nodeStyle
class AB,AC,AD,AE theoryStyle
class B,C,D,E practiceStyle
class F taskStyle

classDef nodeStyle fill:#93c47d,stroke:#000000,stroke-width:0.7px,font-weight:bold,font-size:14px;
classDef theoryStyle fill:#f59542,stroke:#000000,stroke-width:0.7px,font-weight:bold,font-size:14px;
classDef practiceStyle fill:#4287f5,stroke:#000000,stroke-width:0.7px,font-weight:bold,font-size:14px;
classDef taskStyle fill:#42f548,stroke:#000000,stroke-width:0.7px,font-weight:bold,font-size:12px;

1 기계가 학습을 정말(?)

Code.org는 모든 학교의 모든 학생이 초중고 핵심 교육의 일환으로 컴퓨터 과학을 배울 수 있는 기회를 갖는다는 비전에 전념하는 교육 혁신 비영리 단체로 젊은 여성과 기타 소외 계층의 학생 참여를 늘리는 데 중점을 두고 학교에서 컴퓨터 과학에 대한 접근성을 확대하고 있다.

Code.org에서 제작한 인공지능 교육 사례를 살펴보고 다음 심화과정으로 넘어가자

2 AI 모형 개발

티처블 머신(teachable machine)을 사용하면 로컬 컴퓨터에 별다른 설치없이 기계학습(AI 인공지능) 모형을 개발하는 것은 물론 서비스로 출시도 가능하다.

flowchart LR
  A[데이터셋] --> B(기계학습 <br> 훈련)
  B --> C[배포]
  C --> D[추론]
  
  style A fill:#9fe6a0,stroke:#333,stroke-width:2px;
  style B fill:#80c1ff,stroke:#333,stroke-width:2px;
  style C fill:#ffa080,stroke:#333,stroke-width:2px;
  style D fill:#f7ddbb,stroke:#333,stroke-width:2px;  

2.1 문제가 어려운 이유

기계학습(AI) 모형을 개발할 때 가장 중요한 것이 데이터셋이다. 과거 AI 모형은 강아지 그림과 고양이 그림을 잘 구별하지 못하였다. 하지만 2010년 전후로 새로운 인공지능 기술이 개발되면서 이런 문제는 자연히 해결되고 더 나아가 커다란 변혁이 일어났다.

양치기 강아지와 마대자루 걸레

치와와 강아지와 머핀

강아지와 베이글 빵

그림 1: 출처: Puppies Or Food? 12 Pics That Will Make You Question Reality

2.2 데이터셋

Zenodo Cats and Dogs sample 데이터셋은 캐글 고양이와 개 데이터셋에서 추출한 소규모 개와 고양이 데이터셋으로 훈련 세트용 이미지 1000개(고양이 500개, 개 500개)와 테스트 세트용 이미지 400개(각각 200개)가 포함되어 있다.

다운로드 받은 데이터셋을 로컬 컴퓨터에서 압축을 푼다. 고양이와 강아지 사진을 윈도우즈 탐색기를 사용해서 살펴본다.

2.3 훈련

데이터에서 구분된 고양이와 강아지를 이미지를 각각 범주에 넣고 학습버튼을 눌러 학습을 완료시킨다. 필요한 경우 웹캠 혹은 고양이, 강아지 이미지를 구해 출력값이 제대로 나오는지 점검한다.

2.4 배포

우측 미리보기 모델 내보내기 버튼을 눌러 모형을 내보낸다. “공유 가능한 링크”의 복사 버튼을 클릭하면 웹 브라우져에서 접속이 가능한 URL이 생성되어 이를 공유한다.

2.5 실습

  1. 캐글 chihuahua or muffin 데이터셋 다운로드
  2. teachable machine 웹사이트 접속
  3. 치와와 강아지와 머핀을 구분하는 기계학습 모형 개발
    • 치와와 강아지 이미지 (test 폴더)
    • 머핀 이미지 (test 폴더)
  4. 개발완료 후 웹링크 배포하여 공유

3 챗GPT 보안사고

삼성전자 DS 부문 임직원 A씨는 반도체 설비 계측 데이터베이스(DB) 다운로드 프로그램의 소스 코드를 실행 중 오류를 확인했다. 문제가 된 소스 코드 전부를 복사해 챗GPT에 입력, 해결 방법을 문의했다. 삼성전자 설비 계측과 관련한 소스 코드가 오픈AI 학습 데이터로 입력된 셈이다.

임직원 B씨는 수율·불량 설비 파악을 위해 작성한 프로그램 코드를 챗GPT에 입력하는 사고를 냈다. 관련 소스 전체를 챗GPT에 입력하고 코드 최적화를 요청했다. 임직원 C씨는 스마트폰으로 녹음한 회의 내용을 네이버 클로바 애플리케이션(앱)을 통해 문서 파일로 변환한 뒤 챗GPT에 입력했다. 회의록 작성 요청이 목적이다.

로이터 통신 등에 따르면 이탈리아 데이터 보호청은 “챗GPT가 이탈리아의 개인정보 보호 기준과 규정을 충족할 때까지 서비스 접속을 일시적으로 차단할 것”이라고 밝혔다.

접속 차단 이유는 개인정보 침해 우려 때문이다. 이탈리아 당국은 챗GPT가 알고리즘 학습을 이유로, 개인정보를 대량으로 수집하고 저장하는 행위를 정당화할 법적 근거가 없다고 지적했다. 보호청은 챗GPT 개발사 오픈AI가 20일 이내에 해결책을 내놓지 않으면 전 세계 매출액의 최대 4%에 달하는 벌금을 물게 될 것이라고 경고하기도 했다.

4 챗GPT 글쓰기

5 챗GPT 그리기

6 챗GPT 코딩

7 사례분석