앙상블(Ensemble) 이란?
여러 머신러닝 모델을 연결하여 더 강력한 모델을 만드는 기법
랜덤 포레스트(Random Forest) 란?
→ bootstrap 데이터셋을 만들어내고, 모델들의 결정을 종합해서(aggregate) 예측하는 앙상블 기법
새로운 데이터셋을 만들 때, 기존 데이터셋에서 임의로 선택해서 가져옴
→ 이때 중복도 허용된다
[ Bootstrapping을 하는 이유 ]
Bootstrapping은 이러한 획일성을 방지하기 위해 사용됨 (모델마다 다른 bootstrapping 데이터셋 활용)