9  디지털 글쓰기

글쓰기는 인류의 역사와 함께한 중요한 소통 도구로서, 그 방식과 형태는 시대별로 지속적으로 변화해왔다. 최근의 글쓰기 환경은 그 전보다 훨씬 복잡하고 다양한 요소를 요구한다. 과거에는 원고지에 텍스트를 작성하는 것만으로도 충분했다. 한글이나 영어로 이루어진 문장들은 감정을 전달하거나 사실을 나열하며, 이를 통해 독자와의 소통을 이루었다. 그러나 현대의 글쓰기 환경에서는 단순한 텍스트 정보 전달만으로는 부족하다. 이미지, 그래픽, 그리고 인터랙티브한 요소들이 텍스트와 함께 통합되어야 하며, 이를 통해 독자의 관심을 끌고 정보의 흡수를 증진시킨다.

가독성 또한 중요한 고려사항이다. 디자인적인 측면에서 효과적인 글꼴 선택은 텍스트의 내용을 더욱 돋보이게 하며, 독자의 읽기 경험을 향상시킨다. 현대의 글쓰기는 단순한 정보 전달을 넘어서, 그 과정과 결과의 재현성에도 중점을 둔다. 특히 과학연구나 기술문서에서 두드러진다. 자동화 도구와 버전 관리 시스템의 도입을 통해 재현성을 지원하고, 글쓰기 효율성과 투명성을 동시에 높이고 있다.

최근의 눈에 띄는 추세 중 하나는 인공지능 발전과 그에 따른 기계 저작물의 폭증을 들 수 있다. 기계가 작성한 텍스트를 포함한 콘텐츠가 인간 저자와 비슷하거나 오히려 생산 속도나 경제적인 면에서 확실한 우위를 보이면서 이에 대한 연구와 기술적 시도가 활발히 이루어지고 있다.

현대의 글쓰기: 기술적 도전과 진화의 중심

디지털 글쓰기는 검색 엔진에 의해 쉽게 찾아질 수 있도록 설계되어 있으며, 다양한 미디어가 쉽게 통합될 수 있고, 디지털 글쓰기는 발행 후에도 언제든지 쉽게 조작할 수 있어 더 동적이고 생동감을 넣을 수도 있고, 깃(Git)과 같은 버전제어 도구와 연결시켜 글쓰기를 하게 되면 추적도 가능하여 재현가능한 글쓰기가 가능하게 된다. 디지털 글쓰기의 가장 큰 장점 중의 하나는 사람만이 저작을 하는 것이 아니라 기계가 저작한 프로그램도 글쓰기에 담을 수 있어 더욱 풍성한 글쓰기가 가능하다는 점이다.

반면 전통적인 글쓰기는 발행 후 개발이 중단될 뿐만 아니라 한정된 지면(예를 들어 A4, B5)에 다양한 색상을 넣어 강조와 가독성을 높일 수 있으나 인쇄 난이도의 증가로 인해 비용도 급격히 증가하게 되고 무엇보다 정적인 정보만 담을 수 있어 최신 기술 흐름을 반영하는데 한계가 있다.

또한 커뮤니케이션 관점에서 보면 디지털 글쓰기는 온라인 도구를 사용하여 작성 과정의 초기부터 광범위한 청중과 거의 실시간으로 텍스트를 공유할 수 있어 작성 과정이 공개적이고 협업을 기반으로 하고, 저작과정에 별다른 장벽없이 참여할 수 있다는 점에서 전통적인 글쓰기가 소수 저자가 집필을 마무리해야 후속 디자인 작업을 비롯한 후속 출판작업이 진행된다는 면에서 큰 차이가 있다. 특히 전통 글쓰기 결과물이 책과 같은 물리적 매체에 담기게 되면 이를 다시 디지털로 되돌리기 위해 광학문자인식(OCR) 과정을 거쳐야 하며 책속에 담긴 그래프, 표, 이미지 등 데이터는 별도 과정을 거쳐 디지털화 하는 한계도 명확하다.

요약하면, 전통적인 글쓰기가 종이와 펜으로 생각이나 정보를 자유로이 펼칠 수 있어 저자에게 자유로운 표현을 가능했지만 반대급부로 공동저작과 협업이 쉽지 않으며 재사용이 어렵고 증거기반 재현가능한 과학기술 저작물 작성에 뚜렷한 한계가 있고 저작부터 출판까지 시간이 오래소요되고 비용이 많이 들고 품질관리가 쉽지 않은데 최근 등장한 챗GPT와 통합은 불가능에 가깝다는 점이다.

디지털 전환이 가속화되면서 저자의 생각과 전달하는 바를 명확히 하기 위해서는 다양한 디지털 저작 언어와 도구 및 챗GPT와 같은 인공지능도 활용하여 저작해야만 한다는 점에서 디지털 글쓰기는 전통적인 글쓰기와 비교하여 큰 차이가 있다.

9.1 저작 언어

문서 작성을 위한 언어로 제도, 조판, 마크업, 스타일링 언어가 기본적으로 필요하다. 제도 언어(Drawing Language)는 그래픽 디자인과 도면 생성을 위한 SVG와 AutoCAD 가 대표적이고, 조판 언어(Typesetting Language)는 문서 서식과 인쇄를 목적으로 라텍(LaTeX)와 텍(TeX)이 대표적이다. 마크업 언어(Markup Language)는 문서를 구조화하는 것을 목적으로 HTML, XML, 마크다운 등이 있고 스타일링 언어(Styling Language)는 디자인과 레이아웃을 주로 다루며 CSS, SASS, LESS 등이 해당된다.

개발을 위한 프로그래밍 언어로 먼저, 명령형 프로그래밍 언어는 범용 프로그래밍과 알고리즘 구현을 위한 C/C++, 자바, 파이썬 등이 있고, 선언형 프로그래밍 언어는 데이터 처리와 문서 구조화를 목적으로 SQL, HTML, XML 등이 대표적이다. 함수형 프로그래밍 언어는 복잡한 함수 처리와 데이터 분석을 위해 하스켈, Lisp, R 등이 사용되고, 객체지향 프로그래밍 언어는 소프트웨어 개발과 시스템 설계를 위한 C/C++, 자바, 파이썬 등을 꼽을 수 있고, 스크립팅 언어는 자동화와 웹 개발을 주로 다루며 자바스크립트, 파이썬, 루비 등이 해당된다. 쿼리 언어는 데이터베이스 관리와 데이터 검색을 위해 SQL, GraphQL, 정규 표현식 등이 사용되고 마지막으로 동시성 언어는 병렬 처리를 위한 고(Go), 어랭(Erlang), 클로저(Clojure) 등이 있다.

목적 언어/기술 유형 주요 목적 예시
문서 제도 언어 그래픽 디자인, 도면 생성 SVG, AutoCAD
문서 조판 언어 문서 서식, 인쇄 LaTeX, TeX
문서 마크업 언어 문서 구조화 HTML, XML, 마크다운
문서 스타일링 언어 디자인, 레이아웃 CSS, SASS, LESS
개발 명령형 프로그래밍 언어 범용 프로그래밍, 알고리즘 구현 C/C++, 자바, 파이썬
개발 선언형 프로그래밍 언어 데이터 처리, 문서 구조화 SQL, HTML, XML
개발 함수형 프로그래밍 언어 복잡한 함수 처리, 데이터 분석 하스켈, Lisp, R
개발 객체지향 프로그래밍 언어 소프트웨어 개발, 시스템 설계 C/C++, 자바, 파이썬
개발 스크립팅 언어 자동화, 웹 개발 자바스크립트, 파이썬, R, 루비
개발 쿼리 언어 데이터베이스 관리, 데이터 검색 SQL, GraphQL, 정규 표현식
마이크로소프트 워드

마이크로소프트 워드는 1983년에 출시된 워드 프로세서로 마이크로소프트 오피스 일부로 판매되고 있다. 워드 프로세서는 문서 작성을 위한 소프트웨어로 텍스트 편집, 조판, 문서 서식, 인쇄 등을 지원한다. 워드 프로세서는 텍스트 편집과 조판 기능 외에도 문서 작성을 위한 다양한 기능을 제공한다. 아래한글과 기술기반을 공유하고 있는 마이크로소프트 워드는 편집과 조판이 중심이지만 다양한 언어와 기술을 조합하여 제작되었다.

  1. 마크업 언어: 워드 문서는 내부적으로 복잡한 마크업 언어를 사용하여 문서 콘텐츠와 스타일을 분리하고 관리한다.

  2. 스타일링 언어: 워드에는 텍스트 스타일링과 문서 레이아웃을 제어하는 내장 기능이 있어 CSS와 유사한 역할을 하지만 GUI를 통해 제어된다.

  3. 스크립팅 언어: 워드는 VBA(Visual Basic for Applications)와 같은 스크립팅 언어를 내장하여 사용자가 자동화 매크로를 작성을 지원한다.

  4. 쿼리 언어: 워드는 데이터베이스나 다른 외부 데이터 소스와 연동할 수 있고 쿼리 언어가 사용된다. 대표적으로 이름, 주소 등만 다르고 같은 내용이 반복되는 상장, 초대장 등에 메일 머지(“Mail Merge”) 기능을 사용할 때 데이터베이스에서 정보를 가져와 개별적인 문서를 자동으로 생성시킨다.

  5. 텍스트 처리 엔진: 워드는 복잡한 텍스트 레이아웃과 조판을 처리하는 자체 엔진을 가지고 있다. 기본적인 텍스트 입력 및 편집 뿐만 아니라, 고급 서식, 스타일링, 그래픽 삽입, 표 작성, 수식 편집, 문법 및 철자 검사 등 다양한 기능을 제공한다.

  6. 그래픽 언어: 워드는 기본 도형 삽입, SmartArt를 통한 다이어그램 생성, 텍스트 상자와 WordArt, 이미지 편집, 선과 테두리 스타일링, 레이어와 그룹 관리, 드래그 앤 드롭 인터페이스, 커스텀 도형 및 디자인 생성 등이 포함됩니다. 워드 내에서 그래픽과 도면을 쉽게 조작할 수 있고 간단하지만 효과적인 그래픽 표현 언어기능도 내장되어 있다.

9.2 문학적 프로그래밍

최근 저작물은 전통적인 출판 패러다임을 넘어서 급격한 변화를 겪고 있다. 이러한 변화의 중심에는 챗GPT와 같은 생성형 AI의 부상, 다양한 출판 형식 출현과 자동화, 문학적 프로그래밍(literate programming)이라는 새로운 패러다임의 도입이 큰 역할을 하고 있다.

과학기술 저작물은 이제 다양한 출판 형식을 넘어서, 문학적 프로그래밍의 도입으로 새로운 차원의 변화를 겪고 있다. 이 패러다임은 코드와 텍스트를 결합하여 독자에게는 이해하기 쉽고 읽기 좋은 문서를 생성하는 것이 기본이다. 더 나아가, 저자에게는 이러한 방식이 버전 제어 시스템과 통합되어 협업이 강화되고, 문서의 재사용과 유지보수가 더욱 수월해진다. 이로 인해 대규모 문서 저작도 가능해지고 있다.

이러한 변화의 배경에는 빅데이터, 데이터 과학, 생성형 AI와 같은 과학기술 정보의 전달과 공유를 더 효율적으로 하기 위한 필요성이 크게 작용하고 있다. 또한, 인터랙티브 상호작용 기능은 문서의 가독성과 커뮤니케이션 능력을 한층 높여주어, 정보의 효율적인 관리와 전달에 있어 새로운 가능성을 제시하고 있다.

R마크다운(R Markdown)은 10년 이상 다양한 형태의 재현가능하고 추적 가능한 문서 저작에 있어 가능성을 책(bookdown), 블로그(blogdown), 패키지 매뉴얼(pkgdown), PPT(xaringan), 대쉬보드(flexdashboard)와 같은 사례를 통해 증명해왔다. 쿼토는 차세대 R마크다운이라는 별명에 걸맞게 기존의 장점을 유지하면서도, 생성형 AI와 챗GPT가 주도하는 현재의 인공지능 시대에 적합한 새로운 패러다임을 제시하고 있다.

쿼토 개요

9.2.1 위지윅 vs 위지윔

신속하고 빠르게 누구나 짧은 학습을 통해서 문서를 저작하고 출판할 수 있는 방식은 아래한글 혹은 MS워드 워드프로세서를 사용하는데 이는 위지위그(WYSIWYG: What You See Is What You Get, “보는 대로 얻는다”)에 기초한 것으로 문서 편집 과정에서 화면에 포맷된 낱말, 문장이 출력물과 동일하게 나오는 방식을 말한다. 위지윅의 대척점에 있는 것이 위지윔(WYSIWYM, What You See Is What You Mean)으로 대표적인 것인 라텍으로 구조화된 방식으로 문서를 작성하면 컴파일을 통해서 최종 문서가 미려한 출판가능한 PDF, PS, DVI 등 확장자를 갖는 출판결과물을 얻을 수 있다.

위지윅과 위지윔

9.2.2 라텍 철학

라텍은 한마디로 정의하게 되면 “논리적인 디자인”이라고 볼 수 있다. 저작물이 만들어지는 과정은 저작자가 원고를 손으로 쓰거나 타자기로 쳐서 출판사에 넘겨주면, 출판사의 편집디자이너는 원고를 보고 세부적인 출력형식을 결정하여 인쇄소에 넘긴다. 인쇄소는 이를 토대로 과거 식자공이 식자판을 만들었다면 현재는 컴퓨터가 파일을 만든다. 라텍과 텍이 하는 업무가 다소 차이가 난다. (김영록, 2017)

  • 라텍은 편집디자이너에 해당되는 업무를 수행
  • 텍은 식자공에 해당되는 업무를 수행

문서의 논리적 구조와 디자인

컴퓨터를 활용하여 전자조판을 넘긴 이유는 문서를 좀 더 읽기 쉽게 만들어 독자에게 저작자의 생각을 잘 이해시키는 것이다. 이러한 목적을 달성하기 위해서는 문서의 디자인이 그 문서의 논리적 구조를 잘 반영시켜야 하고, 반대로 문서의 논리적 구조를 잘 반영시키기 위해서는 문서 디자이너가 문서의 논리적 구조를 잘 이해해야만 된다. 라텍 명령어는 기본적으로 문서의 논리적 구조를 기술하는 것이다. 이렇게 기술된 명령어를 텍으로 전달하여 조판하게 되어 원하는 최종 결과물을 얻게 된다.

라텍에서 채택하는 논리적 디자인의 가장 큰 장점은 글을 더 잘 쓰게 된다는 점에 있다. 라텍 으로 글을 작성하게 되면 점점 라텍이 채택하고 있는 논리적 디자인에 맞추게 되고 이를 통해서 글쓰기 실력이 향상된다.

아마도 라텍의 가장 큰 장점은 자동화에 있다. 시각적 디자인(Wysiwig)을 채택하여 작성한 문서를 다른 형식으로 변환하거나 문서의 수식의 일련번호를 로마자에서 아라비아 숫자로 모두 변경시키거나 표나 그래프 번호를 일괄번경하는 등 이러한 사례는 자주 발견된다. 특히, 국내외 저널에 제출할 논문을 라텍 으로 작성한 경우 템플릿만 바꾸면 쉽게 고품질 논문을 만들 수 있는데 워드를 이용하여 작성할 경우 수작업을 하게 되어 비생산적인 시간낭비도 크고 미려한 문서를 얻을 수도 없다.

따라서, 라텍으로 글을 쓰게 되면 글쓰기 본질에 집중할 수 있어 저작자의 생각과 의견을 좀더 진솔하게 가감없이 독자에게 전달시킬 수 있게 된다.

9.2.3 블로그 저작

문서를 논리적으로 디자인하는 반대 개념으로 있는 것이 위즈윅(WSYIWIG, What You See Is What You Get) 으로 대표적인 것이 아래한글, MS 워드와 같은 워드 프로세서다. 시각적 디자인을 하게 되면 논리적이지 못한 애매한 조판을 하기 쉽다. 또한, PDF 파일로도 출력을 할 때 미세하나마 출력물에 일관성이 실종되기도 한다.

개인용 컴퓨터가 보급되면서 아래한글과 같은 워드 프로세서를 사용해서 저작을 하는 것이 일반화되었지만 곧이어 인터넷이 보급되면서 웹에 문서를 저작하는 것이 이제는 더욱 중요하게 되었다. 전문 개발자가 아닌 일반인이 HTML, CSS, JavaScript를 학습하여 웹에 문서를 제작하고 출판하는 것은 난이도가 있다보니 워드프레스와 티스토리 같은 위지윅 패러다임을 채택한 저작도구가 사용되고 있으나 상대적으로 HTML, CSS, JavaScript을 조합한 위지윔 방식과 비교하여 고급스러운 면과 함께 정교함에 있어 아쉬움이 있는 것도 사실이다.

워드프레스와 티스토리

 

HTML + CSS + 자바스크립트

웹출판 위지윅과 위지윔

 

9.2.4 재현가능 글쓰기

과학의 근본적인 원칙 중 하나는 연구의 결과가 독립적으로 재현가능해야 한다는 것이다. 이 원칙은 연구 타당성을 확인하고, 그 결과가 일반화 가능한지 검증하는 데 필수적이다. 그러나 2010년 전후, 다양한 학문 분야에서 재현할 수 없는 연구 결과가 다수 발표됨에 따라 과학 커뮤니티 내에서 큰 우려가 발생하였고, 이러한 현상을 재현성 위기(Reproducibity Crisis)라고 부르며, 과학연구 신뢰성을 크게 훼손시켰다.

이 위기에 대응하여, 전 세계 연구자들과 전문가들은 재현가능한 연구 저작을 촉진하고 지원하기 위한 다양한 방안을 모색하기 시작했다. 연구방법론 표준화, 데이터 공유, 연구 소프트웨어 투명성 강화 등 다양한 활동이 들불처럼 일어났고, 기술 커뮤니티 형성과 더불어 다양한 도구와 플랫폼 개발을 통해 재현성 문제를 해결하고자 하는 움직임이 확산되고 있다.

데이터 과학에서 재현성은 핵심적인 요소로 간주된다. 연구 결과의 신뢰성과 타당성을 검증하는 데 있어, 다른 연구자나 전문가들이 동일한 결과를 도출할 수 있도록 연구 과정을 투명하게 공유하는 것은 필수적이다. 이러한 맥락에서 R 팩키지는 재현가능한 데이터 분석 프로젝트를 지원하는 데 중요한 역할을 한다.

그림 9.1: 재현가능한 과학기술 문서 제작과정

특히, R 팩키지를 활용한 연구 개요서(research compendia)는 재현성을 강화하는 훌륭한 도구로 간주된다. 연구 개요서는 연구의 모든 요소(코드, 데이터, 출력 결과물, 환경 등)을 포괄적으로 담고 있어, 연구의 전체 과정을 투명하게 추적하고 검증할 수 있다. 한 사례로 그림 fig-compendium 에 코드부터 단계별로 재현가능한 과학기술 문서 제작과정을 보여주고 있다.

9.3 쿼토와 챗GPT의 등장

쿼토와 챗GPT의 등장은 문서 작성과 관리에 있어 혁신적인 변화를 불러오고 있다. 쿼토는 10년 이상 R마크다운을 통한 검증 과정을 거쳐 실용성이 입증되었다. 쿼토는 위지윅과 순수 텍스트 조판 장점을 결합하여 더욱 유연하고 효율적인 문서 작성 환경과 경험을 제공한다. 쿼토는 R, 파이썬, 자바스크립트, 줄리아, SQL 등 다양한 프로그래밍 언어를 문학적 프로그래밍(Literate Programming) 패러다임에 따라 통합, 재현 가능한 과학기술 연구를 위한 문서와 코드 작성을 지원한다. 복잡한 레이아웃과 수식도 쉽게 처리할 수 있을 뿐만 아니라, 버전 제어와 같은 고급 기능도 지원하고 다양한 형식(HTML, PDF, PPT, ePub, 웹사이트 등)으로의 내보내기 기능을 통해 과학기술 논문 저작, 도서 출판, 웹 출판 등이 수월하다.

챗GPT는 자연어 처리(NLP) 기술을 이용해 문서 작성, 편집, 그리고 검토 과정을 자동화하거나 저작작업을 보조한다. 복잡한 문서 구조와 내용을 신속하게 파악하여, 저자 의도에 맞는 형식과 스타일로 재구성할 수 있다. 더불어, 문서 의미나 목적에 따라 적합한 템플릿을 추천하고, 특정 주제에 대한 추가 정보나 자료도 제공한다. 이러한 기능들이 쿼토와 같은 문서 저작 도구와 통합되면, 저자들은 문서를 더 효율적이고 직관적으로 작성하고 관리할 수 있을 것이다. 챗GPT와 쿼토의 만남은 문서 저작의 새로운 패러다임을 제시하고 있다.

김영록. (2017). 교육 현장에서의 텍의 활용. TeX: 조판, 그 이상의 가능성.