Lista 11 - Nonparametric Methods for Regression: Tree-Based

Qual é a ideia central dos métodos baseados em árvores (Tree-Based Methods) para regressão? Explique como funciona a divisão do espaço de preditores em regiões e como é feita a predição em cada região.
Descreva o processo de construção (building) de uma árvore de regressão. Como são escolhidos os pontos de divisão (splits)? Qual a métrica tipicamente utilizada para avaliar a qualidade de uma divisão?
O que é Tree Pruning (poda de árvore) e por que é necessário? Explique o conceito de cost-complexity pruning e o papel do parâmetro alfa na penalização da complexidade da árvore.
Descreva o algoritmo completo de construção de uma árvore de regressão com poda. Quais são os três passos principais? Como o K-fold cross-validation é utilizado para escolher o valor ótimo de alfa?
O que são métodos de ensemble (Bagging, Random Forests e Boosting)? Explique como cada um funciona e qual a ideia central por trás de combinar múltiplos modelos para melhorar a acurácia preditiva.
Compare Bagging e Random Forests. Qual a diferença fundamental entre os dois métodos? Explique como o Random Forests adiciona aleatoriedade na seleção de variáveis para reduzir a correlação entre as árvores individuais.