4 펭귄 추론
통계학에서의 추론이란, 관측된 데이터를 바탕으로 더 큰 모집단에 대한 일반화된 결론을 도출하는 과정이다. 표본 데이터를 사용하여 모집단의 매개변수(예: 평균, 분산)에 대해 추정하거나 가설을 검정하는 것이 포함된다. 탐색적 데이터 과정을 통해 결측값을 식별하여 적절한 처리를 수행했으며 기술통계량과 시각화를 통해 데이터의 특성을 파악했다. 이제 이러한 데이터를 바탕으로 추론을 수행해보자.
4.1 평균
펭귄 체중이 정규분포를 따르는지 시각적 확인 및 정규성 검정을 수행하자.
#> # A tibble: 3 × 2
#> 종명칭 shapiro_p
#> <fct> <dbl>
#> 1 아델리 0.0423
#> 2 젠투 0.261
#> 3 턱끈 0.561
4.2 턱끈 펭귄
#> # A tibble: 68 × 8
#> 종명칭 섬이름 부리_길이 부리_깊이 물갈퀴_길이 체중 성별 연도
#> <fct> <fct> <dbl> <dbl> <int> <int> <fct> <fct>
#> 1 턱끈 드림 46.5 17.9 192 3500 암컷 2007
#> 2 턱끈 드림 50 19.5 196 3900 수컷 2007
#> 3 턱끈 드림 51.3 19.2 193 3650 수컷 2007
#> 4 턱끈 드림 45.4 18.7 188 3525 암컷 2007
#> 5 턱끈 드림 52.7 19.8 197 3725 수컷 2007
#> 6 턱끈 드림 45.2 17.8 198 3950 암컷 2007
#> 7 턱끈 드림 46.1 18.2 178 3250 암컷 2007
#> 8 턱끈 드림 51.3 18.2 197 3750 수컷 2007
#> 9 턱끈 드림 46 18.9 195 4150 암컷 2007
#> 10 턱끈 드림 51.3 19.9 198 3700 수컷 2007
#> # ℹ 58 more rows
#> 분포 p_값
#> 1 지수분포 0.0000000
#> 2 균등분포 0.0031590
#> 3 정규분포 0.6035116
#> 4 t-분포 0.7771922
4.3 점추정과 구간추정
#> [1] 68
#> [1] 3641.738 3824.439