Implementació d'arbres de decisió amb algoritmes ID3 i criteris de separació C4.5 (Guany d'informació i Gini) per atributs categòrics. Inclou la visualització de l'arbre amb l'objectiu de determinar el tipus d'entitat d'una nova mostra. Especial èmfasi en la manipulació de bases de dades reals, gestió de 'missing values' i discretització de variables contínues.
Implementació de l'algorisme ID3 i el criteri de separació de C4.5 per atributs categòrics. Visualització simple de l'arbre creat per a la classificació de noves mostres. Tractament bàsic dels 'missing values'.
Desenvolupament d'una estratègia avançada per tractar 'missing values' durant les fases d'aprenentatge i predicció.
Aplicació del tractament d'arguments continus explicat a la classe de teoria. Validació de la base de dades resultants.
Implementació de tècniques de reducció de l'overfitting mitjançant pruning o la creació d'un Random Forest. Comparativa amb el sistema original per evitar l'overfitting.