지난 3월부터 6월까지 Gareth James, Daniela Witten, Trevor Hastie와 Robert Tibshirani의 An Introduction to Statistical Learning을 공부하였다. 공부한 내용을 잊어 버리기 않기 위해 깃헙 블로그에 한 챕터씩 내용을 정리해 포스팅해보고자 한다. 혹시라도 이 글을 읽는 누군가에게 작은 도움이 되길 바라며.

통계 학습이란?

통계 학습(statistical learning)은 데이터를 이해하기 위한 방대한 기법을 포함하며, 크게 지도(supervised) 학습과 비지도(unsupervised) 학습으로 나뉜다.

지도 학습은 한 개 이상의 인풋을 가지고 아웃풋을 예측하거나 추정하기 위한 통계 모델을 만드는 것을 말한다. 대표적으로 회귀(regression)와 분류(classification)가 지도 학습에 속한다.

한편, 비지도 학습의 경우에는 지도하는(supervising) 아웃풋 없이 인풋만 있는데, 이로부터 데이터 내 관계나 구조를 알아내는 것이다. 군집화(clustering)가 여기에 해당한다.

챕터 1의 내용은 매우 간단하다. 챕터 2에서는 통계 학습에 대하여 조금 더 상세하게 다룰 것이다.