4  펭귄 추론

통계학에서의 추론이란, 관측된 데이터를 바탕으로 더 큰 모집단에 대한 일반화된 결론을 도출하는 과정이다. 표본 데이터를 사용하여 모집단의 매개변수(예: 평균, 분산)에 대해 추정하거나 가설을 검정하는 것이 포함된다. 탐색적 데이터 과정을 통해 결측값을 식별하여 적절한 처리를 수행했으며 기술통계량과 시각화를 통해 데이터의 특성을 파악했다. 이제 이러한 데이터를 바탕으로 추론을 수행해보자.

4.1 평균

펭귄 체중이 정규분포를 따르는지 시각적 확인 및 정규성 검정을 수행하자.

#> # A tibble: 3 × 2
#>   종명칭 shapiro_p
#>   <fct>      <dbl>
#> 1 아델리    0.0423
#> 2 젠투      0.261 
#> 3 턱끈      0.561

4.2 턱끈 펭귄

#> # A tibble: 68 × 8
#>    종명칭 섬이름 부리_길이 부리_깊이 물갈퀴_길이  체중 성별  연도 
#>    <fct>  <fct>      <dbl>     <dbl>       <int> <int> <fct> <fct>
#>  1 턱끈   드림        46.5      17.9         192  3500 암컷  2007 
#>  2 턱끈   드림        50        19.5         196  3900 수컷  2007 
#>  3 턱끈   드림        51.3      19.2         193  3650 수컷  2007 
#>  4 턱끈   드림        45.4      18.7         188  3525 암컷  2007 
#>  5 턱끈   드림        52.7      19.8         197  3725 수컷  2007 
#>  6 턱끈   드림        45.2      17.8         198  3950 암컷  2007 
#>  7 턱끈   드림        46.1      18.2         178  3250 암컷  2007 
#>  8 턱끈   드림        51.3      18.2         197  3750 수컷  2007 
#>  9 턱끈   드림        46        18.9         195  4150 암컷  2007 
#> 10 턱끈   드림        51.3      19.9         198  3700 수컷  2007 
#> # ℹ 58 more rows
#>       분포      p_값
#> 1 지수분포 0.0000000
#> 2 균등분포 0.0031590
#> 3 정규분포 0.6035116
#> 4   t-분포 0.7771922

4.3 점추정과 구간추정

#> [1] 68
#> [1] 3641.738 3824.439