Publicación: Segmentación de clientes automatizada a partir de técnicas de minería de datos (K-Means Clustering)
Portada
Citas bibliográficas
Código QR
Autores
Director
Autor corporativo
Recolector de datos
Otros/Desconocido
Director audiovisual
Editor/Compilador
Editores
Tipo de Material
Fecha
Cita bibliográfica
Título de serie/ reporte/ volumen/ colección
Es Parte de
Resumen en español
Tiendacol S.A es una empresa del sector de la moda ubicada en la ciudad de Medellín, Colombia, que se dedica al comercio al por menor de prendas de vestir y accesorios en establecimientos especializados. Debido a que la compañía tiene una preocupación por mejorar los esfuerzos comerciales y de servicio al cliente, donde se es consciente de contar con gran cantidad de información en sus sistemas que está siendo subutilizada, se vio la necesidad de desarrollar proyectos que permitan hacer un mejor uso de la información disponible en especial con respecto a estos esfuerzos. Con tal necesidad se planteó implementar un modelo de minería de datos indirecta, a través del cual se logre analizar la información que se tiene de los clientes para clasificarlos automáticamente y agruparlos en grupos de características similares de acuerdo a los patrones de compra. Todo el proceso de minería de datos se diseñó con base en la metodología CRISP-DM que se caracteriza por los buenos resultados en proyectos de esta índole. Con esta se buscó emplear un procedimiento estándar, que tuviera validez en la industria y que se encontrará bien estructurado. Siguiendo dicha metodología se empezó entonces por entender el contexto de los clientes dentro de la empresa, tanto desde el punto de vista del negocio como de la capa de datos. A partir de ello se identificaron las ventas y la cartera como principales procesos relacionados con los clientes, los cuales se encontraban representados por 7 modelos dimensionales dentro de un sistema de inteligencia de negocios. Posteriormente se procedió a diseñar y ejecutar el modelo de clasificación. Inicialmente se extrajeron los datos que constituirían las variables del modelo y se prepararon mediante una estandarización en Z para, finalmente, poder obtener los segmentos a partir del algoritmo k-means clustering. Con los resultados obtenidos se ejecutó adicionalmente un árbol de decisión con el fin de encontrar características adicionales en los grupos encontrados. Se hicieron en total 3 modelos que seguían el proceso anterior pero que diferían en cuanto a sus variables. Los resultados finales permitieron diferenciar 3 segmentos de clientes: i) los mejores, ii) los intermedios y iii) los peores. Los mejores representan los clientes más constantes, que son los que compran montos más grandes, con mayor frecuencia y además adquieren mayor cantidad de créditos; los intermedios son los que compran un número aceptable de veces al año, con montos no muy altos y que además recurren poco a créditos; finalmente, los peores constituyen los clientes más esporádicos y los que menos compran.