Machine learning orientado a limpieza de datos

Se mostrará el uso combinado de clustering no supervisado y random forest para reducir el esfuerzo utilizado en la limpieza de datos. Esta técnica resulta útil cuando se tienen variables las cuales por reglas del negocio están muy relacionadas entre sí (por ejemplo, hora del día y cantidad de tráfico en las calles, peso y altura de una persona.