Documento de Trabajo No. 120
Este estudio analiza el sesgo de datos en un algoritmo de aprendizaje no supervisado diseñado para identificar el riesgo de corrupción en la contratación pública de Colombia. El algoritmo empleado es
un modelo de clustering en dos etapas utilizado para segmentar contratos electrónicos a partir de variables que indican riesgo de corrupción.