Algoritmo de discretización de series tiempo basado en entropía y su aplicación en datos colposcópicos
Beschreibung
La minería de datos en series de tiempo es relativamente una nueva subárea de Descrubrimiento de Conocimiento en Bases de Datos(por sus siglas en inglés KDD), en la cual la dimensión temporal de los datos introduce nuevos retos en las tareas de clasificación y agrupamiento(clustering). Las grandes cantidades de información que contienen las bases de datos temporales requieren de una eficiente representación, no sólo que reduzcan la dimensionalidad, sino también que preserve la información relevante para una clasificación eficiente. Varios enfoques han sido propuestos para representar datos temporales de forma discreta, sin embargo, en su mayoría están orientados a la compresión, más que a la maximización de la información. En esta tesis, se propone un nuevo algoritmo de discretización llamado EBLA3. La idea básica de EBLA3 es minimizar la entropía de los patrones temporales sobre sus etiquetas de clase, encontrando un míınimo número de intervalos, con el cual la base de datos completa pueda ser discretizada. Al mismo tiempo se encuentra el número de segmentos y rangos en que pueden agruparse los segmentos de tiempo, conservando la información relevante. Una gran diferencia con respecto a otros enfoques es que EBLA3 automáticamente encuentra el tamaño y número de intervalos requeridos para la discretización...Verlag
Universidad Veracruzana. Facultad de Física e Inteligencia Artificial. Región Veracruz.