Explique a diferença fundamental entre classificadores gerativos
(Generative Classifiers) e classificadores discriminativos
(Discriminative Classifiers). Dê exemplos de algoritmos para cada uma
das duas abordagens.
No contexto da regressão logística para classificação binária
(\(\mathcal{C} = \{0, 1\}\)):
- Por que não se utiliza a regressão linear padrão diretamente para
estimar a probabilidade condicional? Qual o papel da função logística
(sigmoide)?
- Como é feita a estimação dos parâmetros \(\boldsymbol{\beta}\)? Existe solução
analítica de forma fechada?
O classificador de Bayes é o classificador ótimo na teoria de
decisão.
- Defina o classificador de Bayes e explique o conceito de taxa de
erro de Bayes (Bayes error rate).
- Explique resumidamente o que o teorema de garantia de seleção de
modelo (Model Selection Guarantee) estabelece sobre comparar estimadores
em um conjunto de validação independente.
O algoritmo Naive Bayes é amplamente utilizado devido à sua
simplicidade e eficiência computacional.
- Qual é a suposição “ingênua” (naive) que dá nome ao classificador?
Escreva a fórmula da densidade condicional conjunta sob essa
hipótese.
- Em termos práticos, por que frequentemente computamos a
probabilidade usando a escala logarítmica (log-sum-exp trick/soma de
logs)?
A Análise Discriminante Linear (LDA) e a Análise Discriminante
Quadrática (QDA) são métodos clássicos de classificação gerativa.
- Quais são as suposições distribucionais de cada método e qual a
diferença fundamental entre eles em relação às matrixes de
covariância?
- Como essa diferença afeta o formato das fronteiras de decisão e o
trade-off viés-variância (bias-variance trade-off) entre LDA e QDA?
O classificador \(k\)-Vizinhos
Mais Próximos (\(k\)-NN) é um método
não-paramétrico flexível.
- Explique brevemente como o \(k\)-NN
realiza a classificação de uma nova observação \(\dot{\mathbf{x}}_0\).
- Qual é o efeito prático do valor do hiperparâmetro \(k\) na flexibilidade do modelo (viés e
variância)?
- Por que a padronização (scaling) das variáveis preditoras é um passo
crítico antes de aplicar o \(k\)-NN?