Examinando por Materia "Metagenomics"
Mostrando 1 - 2 de 2
Resultados por página
Opciones de ordenación
Publicación Acceso abierto Análisis de algoritmos para el agrupamiento de muestras metagenómicas(Universidad EIA, 2016) Escobar Vasco, Adriana María; Bonet Cruz, IsisLas formas de vida microscópicas se encuentran en todos los lugares y ambientes del planeta, y en su genética se halla información de gran valor para los científicos, sin embargo al tomar una muestra para estudiarlos solo se logra aislar y cultivar menos del 1% de ellos. La metagenómica nace con el fin de estudiar el otro 99% de la muestra y de descubrir más acerca de estas comunidades. El objetivo de la metagenómica es la secuenciación y el análisis de los genes contenidos en los cromosomas de microorganismos, esfuerzos en los cuales se enfoca el presente proyecto. Para la realización del proyecto se utiliza el programa weka y el algoritmo k-means, implementado en una versión iterativa que utiliza la distancia coseno o euclidiana dependiendo del criterio del experto. Además utiliza cómo parámetro las distancias entre los clústeres para escoger los mejores y optimizar los resultados de la segunda iteración. Con en desarrollo de este proyecto se llega a la conclusión que el k-means iterativo es una mejora al k-means, optimizando los resultados y encontrando clústeres más puros. También se encuentra que los resultados obtenidos con la función de distancia coseno son mejores que aquellos obtenidos con la función euclidiana y que el mejor atributo para describir las distancias es el 4-mer.Publicación Acceso abierto Optimización de algoritmos de agrupamiento aplicados a metagenómica usando big data(Universidad EIA, 2018) Vanegas Piedrahita, Julián; Bonet Cruz, IsisEn el campo de la metagenómica, está incrementando el uso de la metagenómica balística como proceso de extracción de cadenas de aminoácidos de microorganismos previamente no identificados, basándose en muestras ambientales de diversas fuentes. Estas cadenas de aminoácidos, debido al proceso de extracción, son separadas en subcadenas de tamaños variables que luego buscan ser comparadas e identificadas con una base de datos para no sólo determinar qué especies ya reconocidas habitan en las muestras tomadas, sino también qué porciones de estas secuencias de aminoácidos no han sido previamente categorizadas. En búsqueda de que este método de identificación produzca mayores resultados, se usan algoritmos de agrupamiento como facilitadores en el proceso de identificación de las diferentes especies. Estos algoritmos agrupan secuencias de aminoácidos que tienen cierto grado de similitud, produciendo clústeres de subcadenas, para que luego estos puedan ser comparados en grupo y ser más rápidamente analizadas. Con el objetivo de mejorar los tiempos de ejecución, se usaron plataformas como Apache Spark y TensorFlow, que dentro de sus librerías incluyen implementaciones nativas de estos algoritmos de agrupamiento. A partir de estas librerías se implementó el K-means iterativo que fue usado como punto de comparación. En los resultados se puede apreciar que el uso de K-means Iterativo mejora la pureza comparado con la alternativa de una sola iteración, para el caso de uso de una base de metagenómica usando los 4mer como rasgos, y usando el coseno como distancia. Debido a este último punto, y a que la implementación de Apache Spark de K-means no tiene la distancia coseno, se utilizó TensorFlow principalmente para la toma de resultados. El uso de TensorFlow muestra una mejora en general de tiempos de ejecución, siendo mucho más significativa en el caso de K-means Iterativo, teniendo como desventaja que requiere mucho más poder de procesamiento.