23  데이터베이스

graph LR
    subgraph 가져오기["가져오기"]
        ascii[아스키 파일] --> 핸들러_가져오기
        스프레드시트["스프레드시트/통계패키지"] --> 핸들러_가져오기
        데이터베이스 --> 핸들러_가져오기
        통계패키지 --> 핸들러_가져오기    
        웹["웹 데이터"] --> 핸들러_가져오기
    end

    핸들러_가져오기["핸들러"] --> import[가져오기]
    
    subgraph 이해하기["이해하기"]
        모형 --> 시각화
        변환 --> 모형
        시각화 --> 변환
    end

    import --> 깔끔화 --> 이해하기
    이해하기 --> 의사소통

classDef modern fill:#fff,stroke:#333,stroke-width:2px,color:#333,font-family:MaruBuri,font-size:12px;
classDef emphasize fill:#8CBDE3,stroke:#333,stroke-width:3px,color:#333,font-family:MaruBuri,font-size:15px,font-weight:bold;
classDef subgraphStyle fill:#f0f8ff,stroke:#333,stroke-width:2px,color:#333,font-family:MaruBuri,font-size:15px;

class 깔끔화,변환,모형,시각화,의사소통,ascii,웹,스프레드시트,데이터베이스,통계패키지,핸들러_가져오기 modern;
class import,데이터베이스 emphasize;
class 이해하기,가져오기 subgraphStyle;

그림 23.1: 데이터 과학 작업흐름도

23.1 챗GPT SQL

파일 형태 데이터는 로컬 컴퓨터에 저장되어 있어 데이터를 불러오기 쉽지만, 데이터의 크기가 커지면 로컬 컴퓨터 저장공간이 부족하여 서버에 데이터를 저장하게 된다. 데이터베이스에 저장된 데이터는 데이터베이스 관리 시스템(DBMS)을 통해 관리되며, 여러 사용자와 개발자들에게 데이터 관련 서비스를 제공하기 위해 인증단계와 권한을 달리 부여하여 활용된다.

데이터베이스에서 R로 데이터를 가져오는 자세한 기술적인 사항은 “챗GPT SQL” 책(이광춘 2024)을 참조한다. 대표적인 정형 데이터베이스에서 데이터를 가져오는 방법을 주로 다루고 있고, 특히 DuckDB는 속도를 중요시하는 데이터 과학자에게 추천한다.

“챗GPT SQL” 책

이 책은 데이터베이스와 SQL에 대한 기본적인 내용을 다루고 있다. 데이터베이스와 SQL에 대한 기본적인 지식을 습득하고 싶은 분들에게 추천한다.

📘 교보 POD 종이책: https://bit.ly/3OJmMeT
📗 교보 전자책: https://bit.ly/48fujZD
🌐 웹사이트: https://bit.ly/48gYn7d
💻 소스코드: https://bit.ly/3wrgeuP