25  프롬프트 공학

테슬라에서 인공지능(AI) 사업과 오토파일럿 기술책임자를 역임하고 현재 OpenAI에서 근무하고 있는 안드레아 카르파티(Andrej Karpathy)는 현재 가장 인기있는 새로운 프로그래밍 언어로 “영어”를 소개하며 챗GPT가 화려하게 개창한 생성형 AI 시대 프롬프트의 중요성을 설파했다.

안드레아 카르파티 트윗

프롬프트 공학(Prompt Engineering)은 사용자 질문이나 명령을 AI 언어 모형에게 더 정확하게 전달하고, 모형로부터 더 유용한 응답을 얻기 위한 중요한 과정으로 프롬프트 구조, 문법, 키워드 등을 신중하게 선택하고 작성한다. “날씨 어때?”라는 프롬프트 작성보다 “오늘의 날씨를 알려줘”라고 프롬프트를 작성하는 것이 낫다. 그러나 더 구체적인 정보, 예를 들어 풍속이나 습도까지 알고 싶다면 “오늘의 날씨에 대한 자세한 정보를 알려줘”라고 프롬프트를 작성하면 사용자 의도에 더 부합되는 결과를 얻게 된다.

프롬프트 공학은 챗GPT와 같은 AI 언어 모형로부터 구체적이고 정확하며 관련성 있는 응답을 도출하기 위해 프롬프트(Prompt, 지시명령어)를 설계하고 개선하는 과정이다. 프롬프트 품질이 GPT 모형 출력결과에 큰 영향을 미치기 때문에 이 작업은 매우 중요하다. 프롬프트 공학의 목표는 사용자와 AI 모형 사이 커뮤니케이션을 최적화하여 AI 시스템의 유용성과 효율성을 향상시키는 것이다.

프롬프트 공학을 학습하면 AI 언어 모델의 효율성과 효과를 개선하고, 커뮤니케이션을 강화하며, 빠르게 진화하는 인공지능 분야에서 고소득 전문직으로 전환도 가능하다. 프롬프트 엔지니어는 다음과 같은 기여를 할 수 있다.1

25.1 채팅 인터페이스

챗GPT는 거대언어모형(GPT-3.5/GPT-4) AI 채팅 인터페이스를 통해 제공한다. 사용자는 좌측편에 나타나는 프롬프트 채팅 이력을 통해 이전 채팅 대화기록을 확인할 수 있다. 좌측 상단 ‘+ New Chat’ 버튼을 클릭하면 하단에 위치한 채팅 박스에서 ’Send a message …’라는 화면이 나타나고, 이곳에 새로운 메시지를 입력하여 거대언어모형과 프롬프트를 통해 대화를 시작할 수 있다. 채팅 인터페이스는 다른 인터페이스보다 사용자가 AI 언어모형과 의사소통을 원활하게 할 수 있다는 장점이 있다.

프롬프트 명령 대기 상태

 

명령 실행 결과

그림 25.1: ?(caption)

25.2 프롬프트 안내지침

프롬프트 공학은 AI 언어 모형과 효과적인 상호작용을 위한 중요한 과정으로 프롬프트를 설계할 때 고려해야 할 여러 구성 요소가 있는데, 프롬프트를 다음 지침을 준수하여 신중하게 선택하고 적용하면, AI 언어 모형을 통해 사용자 요구에 더 부합하는 답변을 받을 수 있다.

  • 명확성: 프롬프트는 명확하고 이해하기 쉬워야 한다. 즉, AI 언어모델이 혼동할 수 있는 전문 용어, 은어 또는 모호한 언어는 사용하지 않는다.

  • 맥락(Context): AI 언어모델이 해결해야 할 주제나 지시 업무를 파악하는 데 도움이 되는 충분한 맥락(Context)를 제공한다. 질문 혹은 요청과 관련된 배경 정보, 구체적인 세부 정보 또는 예시가 포함된다.

  • 구체성: AI 언어모델이 원하는 답변으로 안내할 수 있도록 프롬프트를 최대한 구체적으로 작성한다. 답변의 형식, 정보의 범위 또는 집중적으로 다루고 싶은 주제의 특정 측면을 지정하는 행위가 포함된다.

  • 모호성 제거: AI 언어모델이 질문을 오해하거나 관련 없는 답변을 제공할 가능성을 줄이려면 프롬프트에 모호성이 있는지 확인한다. 프롬프트가 여러 가지 의미로 해석될 수 있는 경우, 모호함이 없도록 프롬프트를 다시 작성한다.

  • 제약 조건: 단어 수 제한이나 주제의 특정 측면과 같은 제약 조건을 포함하면 AI 언어모델이 보다 집중적이고 관련성 높은 답변을 제공하도록 유도할 수 있다. 특히, 광범위한 주제에 대한 정보를 찾거나 간결한 답변을 찾을 때 유용하다.

  • 지시사항: AI 언어모델이 특정 작업을 수행하거나 특정 방식으로 동작하도록 하려면 프롬프트에 명시적인 지침을 포함한다. 예를 들어, AI에게 장단점을 나열하거나, 두 항목을 비교하거나, 특정 관점을 고려하도록 요청한다.

  • 문법과 철자: AI 언어모형이 수행 작업을 해석할 때 문법 정보를 사용하기 때문에 올바른 문법과 철자법을 맞게 작성하는 것은 중요하다.

25.3 프롬프트 구성요소

프롬프트 공학은 프롬프트를 매개로하여 사용자와 AI 언어모형과 효과적인 상호작용을 위한 중요한 역할을 수행한다. 잘 구성된 프롬프트는 언어모형이 정확하고 유용한 응답을 생성하는 데 큰 도움을 준다. 일반적으로 효과적인 프롬프트는 다음과 같은 구성요소를 포함한다.

  • 도입부: 프롬프트 시작 부분에서는 AI 언어모형에게 수행해야 할 작업에 대한 전반적인 맥락을 제공하여 언어모형이 작업을 정확하게 이해하고 적절한 응답을 생성하는 데 도움을 준다.

  • 작업(Task): AI 언어모형이 수행해야 할 작업을 명확하고 간결하게 지시한다. “텍스트를 요약하라” 또는 “텍스트 감정을 분석하라”와 같은 지시가 이에 해당한다.

  • 안내지침(Instruction): AI 언어모형이 텍스트를 생성할 때 따라야 할 지침을 하달한다. “요약할 때 중요한 핵심만 포함하라” 또는 “감정 분석 시 긍정과 부정을 명확하게 구분하라”와 같은 안내지침이 이에 해당한다.

  • 역할(Role): AI 언어모형이 수행해야 하는 역할을 명시한다. 언어모형이 데이터 과학자, 고객 서비스 대표, 심리상담사, 광고 마케터 역할을 수행해야 함을 역학을 부여하여 명확하게 전달한다.

  • 출력결과: 프롬프트는 원하는 출력 결과 형식을 명시한다. “답변은 목록 형태로 제공하라” 또는 “결과를 단락으로 구분하라”, “마크다운 표 형식으로 작성해라”와 같은 지침이 이에 해당한다.

  • 출력방식: 언어모형이 정보를 어떻게 전달할지에 대한 지침을 제공한다. 예를 들어, “숨을 깊이 들이쉬고 차분히 단계적으로 답변을 간결하게 작성해줘” 또는 “필요한 경우 예시를 들어 설명해줘” 등이 있다.

프롬프트 구성요소

AI 언어모형을 프롬프트 구성요소들을 적절히 조합하여 프롬프트를 작성하면 사용자 요구에 맞는 정확하고 유용한 텍스트를 생성할 수 있다.

프롬프트: 다음 텍스트는 인공지능의 역사와 발전에 대한 내용을 담고 있다. 정보 분석가로서 중요한 포인트만을 포함하여 2~3문장으로 간결하게 요약하라.

챗GPT 응답: 인공지능은 1950년대부터 시작되어 현재까지 다양한 분야에서 활용되고 있다. 최근에는 딥러닝 기술의 발전으로 더욱 빠른 성장을 이루고 있다라고 응답했다.

25.4 프롬프트 작성사례

좋은 프롬프트와 나쁜(?) 프롬프트를 사용하여 생성된 AI 응답을 통해 프롬프트 공학의 중요성을 파악할 수 있다. 응답은 GPT AI 모형과 학습 데이터, 사용자에 따라 달라질 수 있다. 다음 사례를 통해서 잘 작성된 프롬프트는 보다 구체적이고 관련성 있는 응답을 유도하는 반면, 잘못된 프롬프트는 ’밥을 먹으면 배부르다’와 같은 일반적인 답변을 주기 때문에 이에 대해 한두번 손이 더가는 문제가 있다. 반복적인 프롬프트 테스트 및 개선: 다양한 프롬프트 변형을 테스트하고 응답을 분석하면 주어진 목적에 가장 효과적인 프롬프트를 식별하는 데 도움이 될 수 있다.

  • 맥락 특정: 명확한 문맥(context)을 제공하면 ChatGPT와 같은 AI 언어 모형이 적절한 응답을 생성하도록 안내하는 데 도움이 된다. 예를 들어 “유럽 국가의 수도”가 아닌 “프랑스의 수도는 어디인가요?”라고 묻는다면 더 정확한 결과를 얻을 수 있다.

  • 모호성 제거: 프롬프트가 명확해야 모델이 질문을 잘못 이해하거나 관련 없는 답변을 제공할 가능성을 줄일 수 있다.

  • 단계별 설명 요청: 단계별 또는 자세한 설명을 요청하면 AI 모델이 보다 유익한 답변을 생성하는 데 도움이 된다.

  • 명시적 제약 조건: 단어 수 제한이나 주제의 특정 측면을 고려하도록 AI에 요청하는 것같은 제약 조건을 지정하면 보다 집중적인 답변을 얻을 수 있다.

25.4.1 식물 광합성

다음 잘못된 프롬프트는 너무 모호해서 AI가 무작위 또는 관련 없는 응답을 생성할 가능성이 높다. 좋은 프롬프트는 보다 구체적이고 집중적이므로 AI가 관련성 있는 답변을 제공하도록 유도한다.

  • 잘못된 프롬프트: “뭐라도 말해줘.”
  • AI 응답: “바나나는 동남아시아가 원산지인 인기 과일이지만 지금은 세계 여러 곳에서 재배되고 있습니다.”
  • 좋은 프롬프트: “식물의 광합성 과정을 설명하세요.”
  • AI 응답: “광합성은 식물, 조류 및 일부 박테리아가 빛 에너지를 포도당 형태의 화학 에너지로 변환하는 과정입니다. 광합성에는 빛에 의존하는 반응과 빛에 독립적인 반응(캘빈 주기)의 두 가지 주요 단계가 포함됩니다. 빛에 의존하는 반응 동안 엽록소와 다른 색소는 빛 에너지를 흡수하여 ATP와 NADPH를 생성하는 데 사용됩니다. 광 독립 반응에서 CO2는 광 의존성 단계에서 생성된 ATP와 NADPH를 사용하여 일련의 효소 촉매 반응을 통해 유기 분자로 고정됩니다. 광합성의 최종 생성물은 포도당으로, 식물이 성장, 번식 및 기타 과정에 사용할 수 있습니다.”

25.4.2 국가 수도

잘못 작성된 프롬프트는 어느 국가의 수도를 요청하는지 명시하지 않아 모호하다. 좋은 프롬프트는 국가를 명확하게 명시하여 AI가 정확한 정보를 제공할 수 있다.

  • 잘못된 프롬프트: “수도를 말해줘”
  • AI 응답: “세계에는 많은 수도가 있습니다. 질문하는 국가를 지정해 주세요.”
  • 좋은 프롬프트: “독일의 수도는 어디인가요?”
  • AI 응답: “독일의 수도는 베를린입니다.”

25.4.3 과학자

잘못 작성된 프롬프트는 사용자가 어떤 과학자를 언급하고 있는지 불분명하므로 관련성이 없거나 잘못된 응답으로 이어질 수 있다. 잘 작성된 프롬프트는 과학자의 이름을 명시하고 간략한 개요와 요청사항을 명확히 하여 AI가 원하는 정보를 제공하도록 안내한다.

  • 잘못된 프롬프트: “유명한 과학자에 대해 말해줘.”
  • AI 응답: “아이작 뉴턴, 알버트 아인슈타인, 마리 퀴리 등 역사상 유명한 과학자가 많이 있습니다. 관심 있는 과학자에 대한 자세한 정보를 제공하세요.”
  • 좋은 프롬프트: “알버트 아인슈타인의 생애와 과학에 대한 공헌에 대한 간략한 개요를 제공하세요.”
  • AI 응답: “알버트 아인슈타인(1879-1955)은 독일 태생의 이론 물리학자로 역사상 가장 영향력 있는 과학자 중 한 명으로 널리 알려져 있습니다. 그는 공간, 시간, 중력에 대한 우리의 이해에 혁명을 일으킨 상대성 이론으로 가장 잘 알려져 있습니다. 아인슈타인의 유명한 방정식 E=mc^2는 질량과 에너지의 등가성을 증명합니다. 1921년에는 양자 이론의 발전에 기여한 광전 효과의 발견으로 노벨 물리학상을 수상했습니다. 아인슈타인의 연구는 천문학, 핵물리학에서 재료 과학, 우주론에 이르기까지 다양한 분야에 지대한 영향을 미쳤습니다.”

25.4.4 요리법

잘못 작성된 프롬프트는 너무 일반적이어서 AI가 너무 많은 해석을 가능하게 하여 응답의 경우의 수가 많아지게 된다. 잘 작성된 프롬프트는 주제를 특정 요리로 좁히고, 단계별 설명을 요청하므로 AI의 응답이 더 유용하고 관련성이 높게 유도할 수 있다.

  • 잘못된 프롬프트: “음식을 요리하는 방법?”
  • AI 응답: “음식 요리에는 다양한 기술, 재료, 레시피가 필요합니다. 관심 있는 요리 유형이나 요리 방법에 대해 더 구체적인 정보를 제공하세요.”
  • 좋은 프롬프트: “기본적인 파스타 요리를 준비하는 단계를 설명해 주세요.”
  • AI 응답: “기본적인 파스타 요리를 준비하려면 다음 단계를 따르세요:

큰 냄비에 소금물을 넣고 끓입니다.
스파게티, 펜네, 페투치니 등 원하는 파스타를 끓는 물에 넣고 포장지 지침에 따라 알 덴테 식감이 될 때까지 약 8~12분간 조리합니다.
파스타가 익는 동안 간단한 소스를 준비합니다. 기본 토마토 소스는 팬에 올리브 오일을 두르고 다진 마늘을 향이 날 때까지 볶습니다. 으깬 토마토, 소금, 후추, 말린 바질 또는 오레가노를 넣고 10~15분간 끓입니다.
익힌 파스타의 물기를 빼고 파스타 물 한 컵을 남겨둡니다.
파스타를 소스에 넣고 골고루 섞이도록 버무립니다. 소스가 너무 걸쭉하면 남은 파스타 물을 약간 추가하여 묽게 만듭니다.
원하는 경우 파마산 치즈와 신선한 바질로 장식하여 파스타 요리를 뜨겁게 제공합니다.”

25.5 프롬프트 작업흐름

프롬프트를 잘 작성하기 위해서는 목표 정의부터 시작하여 초기 프롬프트 초안 작성, 제약 조건 추가, 프롬프트 테스트, 만족스러운 응답을 얻을 때까지 반복적으로 프롬프트를 평가 및 개선하는 프로세스가 일반적이다. 만족스러운 응답을 GPT AI 모델로부터 얻은 후에는 나중에 참조할 수 있도록 최종 프롬프트를 문서화하는 것을 잊으면 안 된다.

graph TB
A[목표 정의] --> B[프롬프트 초안 작성]
B --> C[제약 조건 또는 사양 추가]
C --> D[프롬프트 테스트]
D --> E[평가 및 개선]
E --> F{응답이 만족스러운가?}
F -- Yes --> G[성공한 프롬프트를 문서화]
F -- No --> E

AI 언어 모델로부터 정확하고 적절한 응답을 유도하는 프롬프트를 설계하고 개선하는 프롬프트 엔지니어링 작업흐름을 다음 같이 단계별로 구성할 수 있다:

  1. 목표 정의: AI 모델에서 얻고자 하는 정보 또는 출력을 명확하게 정의하는 것이 시작점이 된다. 원하는 응답의 범위와 구체성을 결정한다.

  2. 프롬프트 초안 작성: 목표에 직접적으로 도달할 수 있는 명확하고 간결한 프롬프트를 작성한다. 모호하지 않게 AI 언어모델(LLM)이 질문이나 작업을 충분히 이해할 수 있도록 맥락(Context)을 충분히 제공한다.

  3. 제약 조건 또는 사양 추가: 필요한 경우 단어 수 제한이나 AI 언어모델이 집중해야 되는 주제의 특정 측면을 부각하는 제약 조건을 추가한다. 이렇게 하면 모델이 상대적으로 집중적으로 관련성 높은 응답을 뽑아낼 확률이 높다.

  4. 프롬프트 테스트: AI 언어모델에 프롬프트를 입력하고 생성된 응답을 분석한다. 출력의 정확성, 관련성 및 구체성에 특히 주의를 기울인다.

  5. 평가 및 개선: AI의 응답을 바탕으로 프롬프트에 추가 개선이 필요한지 평가한다. 응답이 만족스럽지 않은 경우 모호하거나 명확성이 부족한 부분을 파악하고 그에 따라 프롬프트를 수정 보완한다. 더 많은 맥락을 추가하거나, 질문을 더 구체적으로 만들거나, 단계별 설명을 요청하는 등 추가작업이 수반된다.

  6. 반복: 필요에 따라 4단계와 5단계를 반복하여 원하는 결과를 얻을 때까지 프롬프트를 테스트하고 가다듬는다. 이러한 반복 프로세스는 사용자와 AI 언어모델 간 커뮤니케이션을 최적화하는데 꼭 필요하다.

  7. 성공한 프롬프트를 문서화: 성공적으로 작성한 프롬프트와 프롬프트를 만드는 데 사용된 기술을 기록으로 남겨 문서화시킨다. 이를 통해 모범 사례를 수립하고 향후 프롬프트 엔지니어링 프로세스를 간소화하여 생산성을 높일 수 있다.

25.6 프롬프트 템플릿

가장 기본적인 프롬프트는 언어모형이 수행할 “[작업]”을 지정하고 다음과 같이 생성하라고 지시명령문을 작성한다.

프롬프트: “[작업]을 생성하라”
예: 다음 뉴스기사를 한 문장으로 요약해 주세요!

챗GPT 플러그인 확장기능을 사용하지 않는 경우 외부 URL을 인식하지 못하기 때문에 프롬프트에 해당 기사를 복사하여 붙여넣기해야한다. 농민신문 버젓이 수입·재배된 LMO 종자…검역당국 뭐했나에 실린 오피니언 사설을 요약해보자.

프롬프트: 다음 뉴스기사를 한 문장으로 요약해 주세요!

미국의 유전자변형생물체(LMO) 종자가 버젓이 수입돼 8년이나 재배돼온 사실이 드러났다. 품목은 주키니호박이다. 제조·가공하면 유전자변형 DNA가 안 남아 식품가공용으로 승인받은 원료 작물에 대해서도 유전자변형농산물(GMO) 표시를 하라고 할 정도로 국민적 반감이 거센데, 재배를 통해 얼마든지 증식할 수 있는 LMO 종자가 해외 직구라는 어엿한 경로를 통해 들어와 장기간 재배됐으니 검역망 허술하기가 한심하기 짝이 없다.

종자가 함부로 국경을 넘나들어서는 안되는 이유는 국내법은 물론 국제 규약에도 명시됐다. 우리나라 ‘종자산업법’은 생태계 보호 및 자원 보존에 지장을 줄 우려가 있는 종자는 수입을 제한할 수 있다고 했으며, ’LMO의 국가간 이동 등에 관한 법률’(LMO법)은 생물다양성의 보전 및 지속적 이용에 부정적 영향을 끼칠 수 있는 LMO의 위해를 방지하기 위한 국가의 책무를 적시하고 있다. LMO법은 LMO의 국가간 이동을 규제하는 국제협약인 ’바이오안전성에 관한 카르타헤나 의정서’를 기반으로 하는 만큼 LMO에 대한 우려는 세계 각국이 공히 인정하는 바이기도 하다. 이런데도 LMO 종자가 무사 통관했다는 건 검역당국의 방임이나 능력 부족으로밖에 보이지 않는다.

LMO 주키니호박 재배·판매 사실이 알려진 후 농림축산식품부가 해당 종자 회수에 나서고 교육부가 학교급식에 주키니호박 사용을 중단한 것은 그만큼 사태가 위중해서다. GMO에 대한 국민적 불신이 반영된 조치다. 양심을 속이고 수입 규정을 어긴 업자를 우선 탓해야 하겠지만, 이런 상황을 막기 위해 검역당국이 존재하는 것 아닌가. 종자는 낱알 크기가 작은 데다 속이려고 작정하면 걸러내기 어렵다는 점을 모르지 않으나 그런 해명이 국민의 공감을 얻기는 어렵다.

현행 제도상 빈틈이나 구멍을 완벽히 메우기 어렵다면 응당 검역·통관 시스템을 개선하고 위법자에 대한 처벌도 크게 강화하는 것이 마땅하다. 카르타헤나 의정서에도 나와 있듯 LMO의 국가간 이동이 향후 해당국의 생물다양성은 물론 인체 건강에 어떤 부정적 영향을 줄지 알 수 없기 때문이다. 더구나 지금 상태라면 GMO 관련 장벽을 대폭 완화해야 할 것으로 예상되는 인도·태평양 경제프레임워크(IPEF) 시대에 대한 전망도 암울하다. 문턱이 낮아질수록 넘나듦이 쉬운 건 불문가지다.

AI 응답:

미국 유전자변형생물체(LMO) 종자인 주키니호박이 무사통관돼 국내에서 8년간 재배되어 왔는데, 이는 국내법과 국제 규약을 위반한 것으로 검역망의 부족과 능력 부족으로 보인다는 것과 GMO에 대한 국민적 불신이 반영된 사태이며, 검역·통관 시스템 개선과 위법자에 대한 강화된 처벌이 필요하다는 것이 지적되고 있다.

표준 프롬프트 작성 기법에 역할을 추가하면 좀더 의미있는 기사를 작성하게 된다.

  • 작업: 삼성 갤럭시 23 핸드폰 후기 작성
  • 작성지침: 후기는 객관적이며 유익한 정보를 담고 있어야 하며 전작과 비교하여 특별히 추가된 기능을 강조해야 된다.
  • 역할: 구매 소비자
프롬프트: “휴대폰을 구매하는 소비자로서 이전 모델과 비교하여 새로운 삼성 갤럭시 23 휴대폰의 고유한 기능을 강조하는 객관적이고 유익한 정보를 담고 있는 휴대폰 리뷰를 작성하세요.”

AI 응답:

최근에 새로운 삼성 갤럭시 23 휴대폰을 구매한 소비자로서, 이전 모델과 비교해 보았을 때 큰 업그레이드가 이루어졌다는 것을 확신할 수 있습니다. 그 중에서 가장 눈에 띄는 특징은 향상된 저조도 성능과 개선된 광학 줌이 있는 강력한 트리플 렌즈 카메라 시스템입니다. 또한, 최신 스냅드래곤 프로세서를 장착해 처리 속도가 향상되어 반응성과 사용자 경험이 더욱 빠르고 더욱 원활해졌습니다.

갤럭시 23에는 이전 삼성 모델과 구별되는 여러 가지 고유한 기능이 있습니다. 그 중 하나는 다이나믹 AMOLED 120Hz 디스플레이인데, 화려한 색상과 선명한 대비로 눈에 띄는 시각적 효과를 제공합니다. 또한, 휴대폰의 배터리 크기가 커졌으며 빠른 충전 기능을 갖추고 있어 항상 바쁘게 사용하는 사용자에게 적합합니다.

종합적으로, 새로운 삼성 갤럭시 23은 최첨단 기능을 갖춘 최고급 휴대폰을 찾고 있는 분들에게 추천할 만한 가치가 있습니다. 강력한 카메라 시스템, 빠른 처리 속도 및 디스플레이 품질로 인해 경쟁이 치열한 시장에서 뛰어난 장치로 떠오르고 있습니다.

25.6.1 역할 프롬프트

AI 언어모델에 특정 역할을 부여해서 원하는 챗GPT 결과를 도출하도록 지시명령문을 작성한다.

프롬프트: “[역할]로서 [작업]을 생성하라”
예: “통신회사 콜센터 상담원으로 고객문의에 대해 응답을 생성하시오”

프롬프트: 너는 지금부터 케이블 TV 회사의 고객 서비스 담당자로 역할을 수행할 것입니다. 고객이 콜센터로 삼성 갤럭시 23 핸드폰에 문제가 있다고 전화를 걸어왔습니다. 고객에게 응대를 해야하는데 어떻게 응대할지 작성해보세요.

AI 응답:

네, 고객 서비스 담당자로 역할을 수행하겠습니다.

고객: 삼성 갤럭시 23 핸드폰을 사용하고 있는데, 전화를 걸거나 문자를 보내려고 할 때마다 화면이 꺼져요.

고객 서비스 담당자: 안녕하세요, 삼성 갤럭시 23 핸드폰 고객 서비스입니다. 불편을 드려 죄송합니다. 해당 문제를 해결하기 위해서 몇 가지 질문을 드릴게요. 먼저, 핸드폰을 재부팅해보셨나요? 그리고 핸드폰이 충전이 잘 되고 있는지 확인해 보세요. 만약 이러한 조치가 문제를 해결하지 못한다면, 화면이 자주 꺼지는 경우에는 배터리 절약 모드를 사용하고 있는지 확인해 보세요. 그리고 설정에서 화면 시간을 더 길게 조정해보세요. 만약에 이러한 조치가 문제를 해결하지 못한다면, 저희는 펌웨어 업데이트나 고장 신고 등 추가적인 조치를 취할 수 있도록 도와드리겠습니다. 어떤 조치를 취해 드릴까요?

25.6.2 감성 분류

텍스트에 내재된 감성도 긍부정 혹은 긍정, 부정, 중립으로 나눠 분류하는 작업도 가능하다.

프롬프트: “[텍스트]의 감성을 긍정과 부정 둘 중 하나로 분류하라”
예: “다음 텍스트의 감성을 긍정과 부정 둘 중 하나로 분류합니다. ‘1%라도 기대했던 내가 죄인입니다 죄인입니다….’”

네이버 영화 감성 말뭉치에서 영화 후기 긍정과 부정을 각각 하나씩 뽑아내서 감성분류 작업을 수행한다.

id document label
5912145 왜케 평점이 낮은건데? 꽤 볼만한데.. 헐리우드식 화려함에만 너무 길들여져 있나? 1
9671124 1%라도 기대했던 내가 죄인입니다 죄인입니다…. 0
프롬프트: 다음 텍스트의 감성을 긍정과 부정 둘 중 하나로 분류합니다. 답변은 긍정, 부정 중 하나입니다.

“왜케 평점이 낮은건데? 꽤 볼만한데.. 헐리우드식 화려함에만 너무 길들여져 있나?”

AI 응답:

답변: 긍정

프롬프트: 다음 텍스트의 감성을 긍정과 부정 둘 중 하나로 분류합니다. 그리고 이유도 제시하여 주세요.

“1%라도 기대했던 내가 죄인입니다 죄인입니다….”

AI 응답:

이 텍스트는 부정적인 감성을 나타냅니다. 이유는 “죄인입니다”라는 문구가 있어서 입니다. 이 문구는 자신에 대한 부정적인 평가를 나타내고 있으며, “1%라도 기대했던”이라는 표현은 자신이 어떤 일을 할 때 기대와 다르게 결과가 나온 것으로 추정됩니다. 이러한 표현들은 부정적인 감정을 나타내고 있으며, 따라서 이 텍스트는 부정적인 감성을 가지고 있습니다.

25.6.3 텍스트 분류

네이버 뉴스기사를 각 뉴스 범주별로 나눠 분류하는 것도 가능하다.

프롬프트: “[텍스트]를 다음 중 하나의 범주로 분류하라; A, B, C”
예: “뉴스기사를 다음 중 하나 범주로 분류해야 합니다; 정치, 경제, 사회, 생활/문화, 세계, 기술/IT, 연예, 스포츠. ‘뉴스 기사’”

다음 사례는 네이버 뉴스 카테고리 데이터셋에서 정치뉴스기사 하나를 가져왔다. 압축파일을 풀면 정치(0), 경제(1), 사회(2), 생활/문화(3), 세계(4), 기술/IT(5), 연예(6), 스포츠(7) 총 8개 범주로 나눠 디렉토리에 텍스트 뉴스기사가 포함되어 있다.

프롬프트: 뉴스기사를 다음 중 하나 범주로 분류해야 합니다; 정치, 경제, 사회, 생활/문화, 세계, 기술/IT, 연예, 스포츠.

동남아 담당’ 北 최희철 부상 베이징 도착…싱가포르행 주목 최 부상, 행선지·방문 목적 질문에는 ‘묵묵부답’

(베이징=연합뉴스) 김진방 특파원 = 북한이 북미 정상회담 무산 가능성까지 거론하며 강경한 태도를 보이는 가운데 동남아시아 외교를 담당하는 최희철 북한 외무성 부상이 19일 중국 베이징 서우두(首都) 공항에 모습을 드러냈다.

최 부상은 이날 오전 평양발 고려항공 JS151편을 이용해 베이징 서우두 공항에 도착했다.

최 부상은 최종 목적지를 묻는 취재진의 질문에 아무런 답변을 하지 않고, 북한 대사관 관계자들과 함께 공항을 빠져나갔다.

북미 정상회담을 20여 일 앞둔 상황에서 동남아 외교통인 최 부상이 정상회담 준비 등을 위해 회담 개최 예정지인 싱가포르를 방문할 가능성도 제기되고 있다.

최 부상은 지난 3월에도 아세안(ASEAN·동남아시아국가연합) 의장국이기도 한 싱가포르를 방문해 양국관계와 올해 8월 열리는 아세안지역안보포럼(ARF) 의제 등을 논의한 바 있다.

또 지난해 북핵 문제를 두고 북미 간 긴장관계가 형성됐을 때도 ARF에 참석해 아세안을 상대로 여론전을 펼쳤다. 북한의 초청으로 비자이 쿠마르 싱 인도 외교부 국무장관이 방북했을 때도 최 부상은 싱 국무장관을 직접 영접하고, 한반도 문제를 논의하기도 했다.

베이징 소식통은 “최 부상이 대(對)미 외교담당이 아니기 때문에 싱가포르로 갈 가능성이 큰 것은 아니다”며 “만약 싱가포르에 간다면 정상회담과 관련한 지원 작업 준비 등을 위한 것일 가능성이 크다”고 말했다.

AI 응답:

해당 뉴스는 북한의 외교 정책과 관련된 내용이 있어 정치 범주에 속합니다.

25.6.4 개체명 추출

텍스트에서 사람, 지명, 브랜드 등 기계가 인식해서 추출하는 작업을 통상 개체명인식(NER, Named Entity Recognition) 이라고 한다. GPT-3.5, GPT-4에 따라 성능차이가 다소 있지만 기존 접근법과 비교하여 손색이 없다고 할 수 있다.

프롬프트: “다음 [텍스트]에 대해서 개체명 인식 작업을 수행하고 인물, 조직, 장소로 구분하라.”
예: “다음 뉴스기사에서 개체명을 추출해 주세요. 출력 형식: 인물: <출력결과를 콤마 구분자로 구분> 조직: <출력결과를 콤마 구분자로 구분> 장소: <출력결과를 콤마 구분자로 구분>”

네이버 뉴스 카테고리 데이터셋에서 정치뉴스기사 하나를 가져왔다.

프롬프트: 다음 뉴스기사에서 개체명을 추출해 주세요.

출력 형식: 인물: <출력결과를 콤마 구분자로 구분>
조직: <출력결과를 콤마 구분자로 구분>
장소: <출력결과를 콤마 구분자로 구분>
날짜: <출력결과를 콤마 구분자로 구분>

동남아 담당’ 北 최희철 부상 베이징 도착…싱가포르행 주목 최 부상, 행선지·방문 목적 질문에는 ‘묵묵부답’

(베이징=연합뉴스) 김진방 특파원 = 북한이 북미 정상회담 무산 가능성까지 거론하며 강경한 태도를 보이는 가운데 동남아시아 외교를 담당하는 최희철 북한 외무성 부상이 19일 중국 베이징 서우두(首都) 공항에 모습을 드러냈다.

최 부상은 이날 오전 평양발 고려항공 JS151편을 이용해 베이징 서우두 공항에 도착했다.

최 부상은 최종 목적지를 묻는 취재진의 질문에 아무런 답변을 하지 않고, 북한 대사관 관계자들과 함께 공항을 빠져나갔다.

북미 정상회담을 20여 일 앞둔 상황에서 동남아 외교통인 최 부상이 정상회담 준비 등을 위해 회담 개최 예정지인 싱가포르를 방문할 가능성도 제기되고 있다.

최 부상은 지난 3월에도 아세안(ASEAN·동남아시아국가연합) 의장국이기도 한 싱가포르를 방문해 양국관계와 올해 8월 열리는 아세안지역안보포럼(ARF) 의제 등을 논의한 바 있다.

또 지난해 북핵 문제를 두고 북미 간 긴장관계가 형성됐을 때도 ARF에 참석해 아세안을 상대로 여론전을 펼쳤다. 북한의 초청으로 비자이 쿠마르 싱 인도 외교부 국무장관이 방북했을 때도 최 부상은 싱 국무장관을 직접 영접하고, 한반도 문제를 논의하기도 했다.

베이징 소식통은 “최 부상이 대(對)미 외교담당이 아니기 때문에 싱가포르로 갈 가능성이 큰 것은 아니다”며 “만약 싱가포르에 간다면 정상회담과 관련한 지원 작업 준비 등을 위한 것일 가능성이 크다”고 말했다.

AI 응답:

인물: 최희철, 김진방, 비자이 쿠마르 싱
조직: 연합뉴스, 북한 외무성, 고려항공, 아세안(ASEAN·동남아시아국가연합), 아세안지역안보포럼(ARF), 인도 외교부
장소: 베이징, 서우두(首都) 공항, 평양, 싱가포르, 북한 대사관
날짜: 19일, 20여 일, 지난 3월, 올해 8월, 지난해

25.6.5 질의응답

지문이 주어진 상태에서 사람이 질문을 하면 기계가 답을 하는 상황이다. 전문적이고 매우 긴 지문에서 원하는 답을 찾기 위해 질문을 하는 상황에서 유용하다.

프롬프트: “다음 [지문]에서 [질문]에 답하시오”
예: “다음 지문을 읽고 답을 찾으세요. 질문: 김현웅은 서울고등검찰청 검사장 재직 중에 몇대 법무부 장관에 임용되었나?

지문: 김현웅(金賢雄, 1959년 5월 4일 ~ , 전남 고흥)은 … ”

KorQuAD 2.0는 KorQuAD 1.0에서 질문답변 20,000+ 쌍을 포함하여 총 100,000+ 쌍으로 구성된 한국어 Machine Reading Comprehension 데이터셋으로, KorQuAD 1.0과는 다르게 1~2 문단이 아닌 Wikipedia article 전체에서 답을 찾아야 한다. KorQuAD 데이터셋에서 사례를 하나 가져와서 질의응답을 풀어본다.

실제 정답 라벨: [{'text': '제64대', 'answer_start': 209}]

프롬프트: 다음 지문을 읽고 답을 찾으세요.

질문: 김현웅은 서울고등검찰청 검사장 재직 중에 몇대 법무부 장관에 임용되었나?

지문: 김현웅(金賢雄, 1959년 5월 4일 ~ , 전남 고흥)은 대한민국의 법률가이다. 사법연수원 16기 수료 후 검사 생활을 했으며 특히 서울중앙지검 특수1부 부장검사로 재직할 때는 법조브로커 김홍수씨(58·구속)로부터 금품을 받은 혐의(알선수재)로 사상 최초로 전직 고등 법원 부장판사급 법관 A씨에 대해 사전 구속영장을 청구했다. 이후 제46대 서울고등검찰청 검사장 재직 중 제64대 법무부 장관에 임용되었다. 대한변호사협회(회장 김현)가 김현웅(58·사법연수원 16기) 전 법무부 장관에게 변호사 개업을 자제할 것을 권고했다. 변협은 보 도자료를 통해 “김현웅 전 장관은 지난 4월27일 변호사 등록을 신청했고, 현행 변호사법상 등록 거부 사유가 없다”라며 “변호사법은 등록 신청일로부터 3개월간 등록을 하지 않을 경우 등록이 간주된다고 규정하고 있다”라고 설명했다.

AI 응답:

김현웅은 서울고등검찰청 검사장 재직 중에 제64대 법무부 장관에 임용되었다.

25.6.6 객관식 문제

주어진 4개 중에서 정답을 하나 고르는 문제를 사지선다(四枝選多)형 시험문제로 학창시절부터 접해 친숙하다. 사지선다 문제를 풀고 문제도 생성하는 프롬프트를 제작해보자.

프롬프트: “다음 [선택지] 중에서 정답을 하나 고르세요.”
예: “다음 문제에서 정답을 하나 고르세요. 문제: 통계에서 모든 경우의 수를 포함하는 집합을 일컷는 용어는?

  1. 표본 공간(Sample Space)
  2. 포함집합(Super Set)
  3. 포함공간(Super Space)
  4. 표본집합(Sample Set) ”

정답과 이유도 추가하고 유사한 사지선다형 문제를 몇개 만들어 지시한다.

프롬프트: 통계에서 두 변수 간의 상관 관계를 나타내는 지수는?
  1. 중앙값(Median)
  2. 평균(Average)
  3. 분산(Variance)
  4. 상관계수(Correlation Coefficient)

AI 응답:

정답: 4. 상관계수(Correlation Coefficient) 이유: 통계에서 두 변수 간의 관련성을 측정하는 방법 중 하나가 상관계수입니다. 상관계수는 -1에서 1 사이의 값을 가지며, 1에 가까울수록 양의 상관관계, -1에 가까울수록 음의 상관관계, 0에 가까울수록 상관관계가 없다는 것을 의미합니다.