Publicación:
Detección de homólogos remotos usando propiedades fisicoquímicas

dc.contributor.authorBedoya, Óscarspa
dc.date.accessioned2017-09-12 00:00:00
dc.date.accessioned2022-06-17T20:19:42Z
dc.date.available2017-09-12 00:00:00
dc.date.available2022-06-17T20:19:42Z
dc.date.issued2017-09-12
dc.description.abstractEn este artículo se presenta un nuevo método para la detección de homólogos remotos en proteínas llamado CDA (Análisis de Distribución de Característica). El método CDA utiliza distribuciones de las propiedades fisicoquímicas de los aminoácidos para cada proteína. Dadas las secuencias de entrenamiento de una familia SCOP (Clasificación Estructural de Proteínas), se calcula su correspondiente distribución característica promediando los valores de las distribuciones para las proteínas que la componen. La hipótesis en esta investigación es que cada familia de proteínas F tiene una distribución característica que separa sus secuencias del resto de las proteínas en un conjunto de datos. Se seleccionó un conjunto de 72 propiedades fisicoquímicas para crear diferentes distribuciones características de la misma familia. Cada distribución característica se usa como un clasificador de familias SCOP. Por último, se utiliza una clasificador Bayesiano para combinar la información de los clasificadores individuales y obtener una mejor decisión. Encontramos que cada familia tiene un conjunto de propiedades fisicoquímicas que permiten una mejor discriminación de sus secuencias. El método CDA alcanza una tasa de aciertos positivos de 0,793, una tasa de falsos positivos de 0,005 y un puntaje ROC de 0,918. El método propuesto mejora la precisión de algunas de las estrategias existentes tales como SVM-PCD y SVM-RQA.spa
dc.description.abstractEn este artículo se presenta un nuevo método para la detección de homólogos remotos en proteínas llamado CDA (Análisis de Distribución de Característica). El método CDA utiliza distribuciones de las propiedades fisicoquímicas de los aminoácidos para cada proteína. Dadas las secuencias de entrenamiento de una familia SCOP (Clasificación Estructural de Proteínas), se calcula su correspondiente distribución característica promediando los valores de las distribuciones para las proteínas que la componen. La hipótesis en esta investigación es que cada familia de proteínas F tiene una distribución característica que separa sus secuencias del resto de las proteínas en un conjunto de datos. Se seleccionó un conjunto de 72 propiedades fisicoquímicas para crear diferentes distribuciones características de la misma familia. Cada distribución característica se usa como un clasificador de familias SCOP. Por último, se utiliza una clasificador Bayesiano para combinar la información de los clasificadores individuales y obtener una mejor decisión. Encontramos que cada familia tiene un conjunto de propiedades fisicoquímicas que permiten una mejor discriminación de sus secuencias. El método CDA alcanza una tasa de aciertos positivos de 0,793, una tasa de falsos positivos de 0,005 y un puntaje ROC de 0,918. El método propuesto mejora la precisión de algunas de las estrategias existentes tales como SVM-PCD y SVM-RQA.eng
dc.format.mimetypeapplication/pdfspa
dc.identifier.doi10.24050/reia.v14i27.1161
dc.identifier.eissn2463-0950
dc.identifier.issn1794-1237
dc.identifier.urihttps://repository.eia.edu.co/handle/11190/5025
dc.identifier.urlhttps://doi.org/10.24050/reia.v14i27.1161
dc.language.isospaspa
dc.publisherFondo Editorial EIA - Universidad EIAspa
dc.relation.bitstreamhttps://revistas.eia.edu.co/index.php/reveia/article/download/1161/1058
dc.relation.citationeditionNúm. 27 , Año 2017spa
dc.relation.citationendpage125
dc.relation.citationissue27spa
dc.relation.citationstartpage111
dc.relation.citationvolume14spa
dc.relation.ispartofjournalRevista EIAspa
dc.rightsRevista EIA - 2017spa
dc.rights.accessrightsinfo:eu-repo/semantics/openAccessspa
dc.rights.coarhttp://purl.org/coar/access_right/c_abf2spa
dc.rights.urihttps://creativecommons.org/licenses/by-nc-sa/4.0/spa
dc.sourcehttps://revistas.eia.edu.co/index.php/reveia/article/view/1161spa
dc.subjectDetección de homólogos remotosspa
dc.subjectfamilia SCOPspa
dc.subjectpropiedades fisicoquímicas.spa
dc.titleDetección de homólogos remotos usando propiedades fisicoquímicasspa
dc.title.translatedDetección de homólogos remotos usando propiedades fisicoquímicaseng
dc.typeArtículo de revistaspa
dc.typeJournal articleeng
dc.type.coarhttp://purl.org/coar/resource_type/c_6501spa
dc.type.coarhttp://purl.org/coar/resource_type/c_6501spa
dc.type.coarversionhttp://purl.org/coar/version/c_970fb48d4fbd8a85spa
dc.type.contentTextspa
dc.type.driverinfo:eu-repo/semantics/articlespa
dc.type.redcolhttp://purl.org/redcol/resource_type/ARTREFspa
dc.type.versioninfo:eu-repo/semantics/publishedVersionspa
dspace.entity.typePublication
Archivos