Publicación: Identificación temprana de deterioro cardiovascular mediante técnicas de Machine Learning
Portada
Citas bibliográficas
Código QR
Autor corporativo
Recolector de datos
Otros/Desconocido
Director audiovisual
Editor/Compilador
Editores
Tipo de Material
Fecha
Cita bibliográfica
Título de serie/ reporte/ volumen/ colección
Es Parte de
Resumen en español
RESUMEN: Las enfermedades infecciosas representan un problema de gran importancia en el contexto hospitalario dado que son un peligro de gran magnitud dentro de una institución de salud, siendo los pacientes de cuidados intensivos una población muy vulnerable por su delicada condición. Así bien, el deterioro cardiovascular es uno de los agentes más determinantes a la hora del desarrollo de una enfermedad infecciosa, pues este es uno de los órganos y sistemas que primero se ven afectados a la hora de presentarse una infección, además de representar un aumento sustancial en la mortalidad de los pacientes cuando este se presenta. Actualmente gracias a los avances en el campo de instrumentación médica, la maquinaria implicada en el monitoreo y mantenimiento de los pacientes genera constantemente información sobre las variables que se ven implicadas en tales procesos, información que no se utiliza en ningún proceso de diagnóstico o seguimiento de posibles condiciones desarrolladas por el paciente. Con esto dicho, el objetivo de este proyecto es el de, a partir de técnicas de Machine Learning, un sub campo de la inteligencia artificial que se basa en la abstracción de información y la búsqueda de patrones dentro de un grupo de datos, encontrar un método de identificación temprana de deterioro cardiovascular en pacientes infectados a partir de datos recopilados de pacientes en la unidad de cuidados intensivos, obtenidos de una base de datos en la red (MIMIC) y de una institución de salud local (clínica de Las Américas). Para la ejecución de este proyecto en primer lugar se realizó todo el proceso de descarga de datos de las respectivas fuentes (MIMIC e institución local) y además se definió el deterioro cardiovascular en dos parámetros: presión arterial media por debajo de 70 mmHg y suministro de vasopresores. Con estos parámetros se procedió a realizar el acondicionamiento de los datos en PostgreSQL donde se obtuvieron las cohortes definitivas con y sin sospecha de infección con el fin de analizar el comportamiento del modelo de las dos maneras. Con la obtención de la cohorte de ambas bases de datos, se realizó todo el análisis de cohortes en la herramienta Power BI y la minería de datos en el programa informático Orange, donde se definieron las variables a ingresar con el criterio de aporte de información mínimo del 1% en los métodos de puntuación. Se seleccionaron los parámetros y los modelos de predicción para trabajar con los datos de MIMIC y definir cuál modelo alcanzaba mejores métricas. Estos resultados se analizaron a través de la herramienta Power BI y se seleccionó el modelo con las métricas más altas. Este modelo fue evaluado con los datos de la institución local. Por último, se realizó el diseño de la interfaz gráfica del modelo en el programa Figma y se realizó un video simulando la interacción que tendría el profesional con la interfaz del modelo predictivo. Los resultados mostraron que no hubo una diferencia significativa en el desempeño de los modelos para las muestras de pacientes con y sin sospecha de infección, es decir que el funcionamiento del modelo no cuenta con casi ninguna dependencia relacionada a esta variable. Los modelos relacionados con Gradient Boosting contaron con un desempeño más sobresaliente en el set de datos de la clínica de una institución de salud local, gracias a su capacidad para trabajar de forma óptima en muestras con datos faltantes, por lo que se recomienda trabajar con el modelo Gradient Boosting con las respectivas variables definidas.
Resumen en inglés
ABSTRACT: Infectious diseases represent a problem of great importance in the hospital context since they are a danger of great magnitude within a health institution, being intensive care patients a very vulnerable population due to their delicate condition. Thus, cardiovascular deterioration is one of the most determining agents in the development of an infectious disease, since this is one of the organs and systems that are first affected when an infection occurs, in addition to representing a substantial increase in patient mortality when it occurs. Currently, thanks to advances in the field of medical instrumentation, the machinery involved in the monitoring and maintenance of patients constantly generates information on the variables that are involved in such processes, information that is not used in any diagnostic process or monitoring of possible conditions developed by the patient. With this said, the objective of this project is to use Machine Learning techniques, a subfield of artificial intelligence based on the abstraction of information and the search for patterns within a group of data, to find a method of early identification of cardiovascular deterioration in infected patients from data collected from patients in the intensive care unit, obtained from a web-based database (MIMIC) and from a local health institution (Las Americas clinic). For the execution of this project, first of all, the entire process of downloading data from the respective sources (MIMIC and local institution) was carried out and, in addition, cardiovascular deterioration was defined in two parameters: mean arterial pressure below 70 mmHg and vasopressor administration. With these parameters, we proceeded to condition the data in PostgreSQL where we obtained the definitive cohorts with and without suspected infection in order to analyze the behavior of the model in both ways. With the cohort obtained from both databases, all the cohort analysis was performed in the Power BI tool and data mining in the Orange software, where the variables to be entered were defined with the minimum information contribution criterion of 1% in the scoring methods. Parameters and prediction models were selected to work with the MIMIC data and define which model achieved better metrics. These results were analyzed through the Power BI tool and the model with the highest metrics was selected. This model was evaluated with the data from the local institution. Finally, the graphic interface of the model was designed in the Figma program and a video was made simulating the interaction that the professional would have with the interface of the predictive model. The results showed that there was no significant difference in the performance of the models for the samples of patients with and without suspected infection, concluding that the performance of the model has almost no dependence related to this variable. The models related to Gradient Boosting had a more outstanding performance in the data set of the clinic of the Americas, thanks to its ability to work optimally in samples with missing data, so it is recommended to work with the Gradient Boosting model with the respective variables defined.