Publicación: Modelo de predicción de default en pymes de la ciudad de Medellín
Portada
Citas bibliográficas
Código QR
Autores
Director
Autor corporativo
Recolector de datos
Otros/Desconocido
Director audiovisual
Editor/Compilador
Editores
Tipo de Material
Fecha
Cita bibliográfica
Título de serie/ reporte/ volumen/ colección
Es Parte de
Resumen en español
RESUMEN: El presente trabajo de grado tiene como objetivo desarrollar y comparar modelos predictivos para estimar el riesgo de default en pequeñas y medianas empresas (Pymes) de la ciudad de Medellín, utilizando técnicas de clasificación supervisada como regresión logística, random forest y redes neuronales. A partir de información financiera histórica proveniente de la Superintendencia de Sociedades, se construyó una base de datos con variables relevantes para el análisis del comportamiento crediticio empresarial. Cada modelo fue entrenado y evaluado mediante métricas de desempeño como precisión, sensibilidad, especificidad y exactitud, con el fin de determinar su capacidad para discriminar entre empresas riesgosas y no riesgosas. Los resultados evidencian que el modelo de Random Forest obtuvo el mejor rendimiento general, con una exactitud del 96.3%, una alta sensibilidad de 98.7% y una precisión del 94.3%, lo que lo posiciona como la alternativa más eficaz para predecir el incumplimiento de pagos. Se concluye que el uso de modelos avanzados de machine learning puede ser una herramienta valiosa para las entidades financieras al momento de gestionar el riesgo crediticio del segmento Pyme. Asimismo, se recomienda su integración en la etapa de análisis de riesgo dentro del proceso de otorgamiento de crédito, permitiendo una toma de decisiones más objetiva, ágil y fundamentada en datos.
Resumen en inglés
ABSTRACT: This undergraduate thesis aims to develop and compare predictive models to estimate the risk of default in small and medium-sized enterprises (SMEs) located in Medellín, Colombia, using supervised classification techniques such as logistic regression, random forest, and neural networks. This analysis of credit outcomes is based on historical financial data extracted from “Super intendencia de Sociedades de Colombia” – the surveillance entity for commercial companies. Each model was trained and evaluated using performance metrics such as precision, recall, specificity, and accuracy to determine their ability to distinguish between risky and non-risky companies. The results show that the Random Forest model achieved the highest overall performance, with an accuracy of 96.3%, a recall of 98.7%, and a precision of 94.3%, making it the most effective choice for predicting credit default. In conclusion, advanced machine learning models can serve as valuable tools for financial institutions when managing credit risk in the SME segment. Hence it is recommended that these models be integrated into the credit study process to enable more objective, efficient, and data-driven decision-making.