앙상블(Ensemble) 이란?

여러 머신러닝 모델을 연결하여 더 강력한 모델을 만드는 기법

랜덤 포레스트(Random Forest) 란?

Bagging

→ bootstrap 데이터셋을 만들어내고, 모델들의 결정을 종합해서(aggregate) 예측하는 앙상블 기법

Bootstrapping

스크린샷 2024-07-31 오후 5.55.28.png

새로운 데이터셋을 만들 때, 기존 데이터셋에서 임의로 선택해서 가져옴

→ 이때 중복도 허용된다

[ Bootstrapping을 하는 이유 ]

Bootstrapping은 이러한 획일성을 방지하기 위해 사용됨 (모델마다 다른 bootstrapping 데이터셋 활용)