Método Sistemático para Mitigar el Problema de las Clases No Balanceadas con Alta Dimensionalidad y Solapamiento en Big Data

dc.contributor.advisorGarcía Jiménez, Vicente
dc.contributor.authorBolívar Velazco, Armando Isaac
dc.coverage.spatialCiudad Juárez, Chihuahua
dc.date.accessioned2026-06-12T20:24:04Z
dc.date.available2026-06-12T20:24:04Z
dc.date.issued2026-04-24
dc.description.abstractUno de los principales desafíos del análisis de datos es la magnitud de la información, tanto en número de observaciones como en variables. Big data alude a volúmenes que exceden la capacidad de un sistema individual; la alta dimensionalidad, a un número de atributos que dificulta el análisis y la generalización de modelos. También aparecen clases desbalanceadas, con pocas instancias de interés, y solapamiento entre clases, que complican la identificación precisa. Esta tesis revisa técnicas para entornos de big data y datos tradicionales, evaluando cómo afrontan alta dimensionalidad, desbalance y solapamiento. A partir de ese análisis se propone un método sistemático: una secuencia de técnicas aplicadas en orden concreto para mitigar estas dificultades en problemas de clasificación. Primero se emplean distancias fraccionarias en espacios de disimilitud para contrarrestar la alta dimensionalidad. Luego se realiza una búsqueda distribuida del vecino más cercano en múltiples nodos, que sirve como base para una versión adaptada de SMOTE orientada a big data para sobremuestreo y manejo del desbalance. Además, se incorpora una implementación de la edición de Wilson para big data, desarrollada en esta tesis, para reducir el solapamiento entre clases. El método propuesto disminuye la complejidad y el tamaño de los datos y mejora, de forma estadísticamente significativa, las tasas de clasificación.
dc.formatPDF
dc.identifier.urihttps://hdl.handle.net/20.500.11961/7116
dc.language.isospaes
dc.publisherUniversidad Autónoma de Ciudad Juárezes
dc.relation.ispartofDoctorado en Ciencias de la Ingeniería Avanzadaes
dc.relation.ispartofInstituto de Ingeniería y Tecnologíaes
dc.relation.ispartofDepartamento de Ingeniería Eléctrica y Computaciónes
dc.rightsAttribution-NonCommercial-NoDerivs 2.5 Mexicoen
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/2.5/mx/
dc.subjectAlta dimensionalidad, big data, desbalance de clases, preprocesamiento de datos, aprendizaje automático.
dc.subject.otherinfo:eu-repo/classification/cti/7
dc.subject.secihtiIngenierias y Desarrollo Tecnológico
dc.titleMétodo Sistemático para Mitigar el Problema de las Clases No Balanceadas con Alta Dimensionalidad y Solapamiento en Big Data
dc.typeTesis doctorales
dc.typeTrabajo de titulación de posgradoes
dcterms.thumbnailhttp://ri.uacj.mx/vufind/thumbnails/pi-iit-doctorado.pnges

Archivos

Bloque original
Mostrando 1 - 1 de 1
Cargando...
Miniatura
Nombre:
TesisFinal_ARMANDO ISAAC BOLIVA.pdf
Tamaño:
2.97 MB
Formato:
Adobe Portable Document Format