Questão
2024
FGV
Empresa de Pesquisa Energética
Analista de Gestão Corporativa - Tecnologia da Informação - Ciência de Dados (EPE)
tecnicas-aprendizado1088a9eb582
As técnicas de aprendizado supervisionado estão baseadas na determinação de modelos capazes de otimizar o mapeamento entre entradas e saídas de um conjunto de dados. Por vezes, o processo de treinamento pode gerar modelos muito complexos que “aprendem” o ruído existente nos conjuntos de dados, caracterizando o fenômeno de sobreajuste ou overfitting.

Um método que pode ajudar a mitigar a ocorrência do overfitting consiste em

I. dividir o conjunto de dados em k partes;

II. utilizar uma das partes para teste e as outras k-1 para treinamento;

III. repetir o processo para cada uma das k partes do conjunto de dados; e

IV. avaliar a média das métricas de performance para o modelo.

O método acima é chamado de
A
k vizinhos mais próximos (k nearest neighbors ou k-NN).
B
retropropagação (backpropagation).
C
validação cruzada (cross-validation).
D
regularização Lasso (Lasso regularization).
E
comitê de modelos (model ensembling).