BREIMAN & CUTLER의 RANDOM FORESTS
Random Forests®
CART®(Classification & Regression Trees) 컬렉션에 기반을 두고 있는 Random Forests® (랜덤 포레스트)모형화 엔진은 각 CART 트리에서 수행하는 예측을 합해 포레스트의 전체 예측을 결정하면서 의사결정 트리가 서로의 영향을 받지 않도록 합니다.
Random Forests에 생소한 이들은 Random Forests가 Leo Breiman과 Adele Cutler가 캘리포니아 대학교 버클리에서 개발한 강력한 앙상블 기술로, 여러 예측 모형화 실무자들의 선택을 받고 있다고 이해하면 쉽습니다. 알고리즘은 단순해 보이지만 독립적인 트리를 수백 개 작성하고 관측과 변수 모두전체에서 추출한 여러 표본을 사용합니다.
OOB(out-of-bag) 데이터를 기준으로 편향 없이 모형의 성능을 평가하는 Random Forests만의 고유한 기능을 사용하면 학습/검증 표본을 따로 추출해야 할 필요가 없어집니다. 이를 통해 Random Forests는 변수 수가 사용 가능 관측 수보다 몇 배가 더 많은 다양한 데이터 애플리케이션에 가장 많이 사용되는 예측 모형화 도구로 등극했습니다.