Método Sistemático para Mitigar el Problema de las Clases No Balanceadas con Alta Dimensionalidad y Solapamiento en Big Data
| dc.contributor.advisor | García Jiménez, Vicente | |
| dc.contributor.author | Bolívar Velazco, Armando Isaac | |
| dc.coverage.spatial | Ciudad Juárez, Chihuahua | |
| dc.date.accessioned | 2026-06-12T20:24:04Z | |
| dc.date.available | 2026-06-12T20:24:04Z | |
| dc.date.issued | 2026-04-24 | |
| dc.description.abstract | Uno de los principales desafíos del análisis de datos es la magnitud de la información, tanto en número de observaciones como en variables. Big data alude a volúmenes que exceden la capacidad de un sistema individual; la alta dimensionalidad, a un número de atributos que dificulta el análisis y la generalización de modelos. También aparecen clases desbalanceadas, con pocas instancias de interés, y solapamiento entre clases, que complican la identificación precisa. Esta tesis revisa técnicas para entornos de big data y datos tradicionales, evaluando cómo afrontan alta dimensionalidad, desbalance y solapamiento. A partir de ese análisis se propone un método sistemático: una secuencia de técnicas aplicadas en orden concreto para mitigar estas dificultades en problemas de clasificación. Primero se emplean distancias fraccionarias en espacios de disimilitud para contrarrestar la alta dimensionalidad. Luego se realiza una búsqueda distribuida del vecino más cercano en múltiples nodos, que sirve como base para una versión adaptada de SMOTE orientada a big data para sobremuestreo y manejo del desbalance. Además, se incorpora una implementación de la edición de Wilson para big data, desarrollada en esta tesis, para reducir el solapamiento entre clases. El método propuesto disminuye la complejidad y el tamaño de los datos y mejora, de forma estadísticamente significativa, las tasas de clasificación. | |
| dc.format | ||
| dc.identifier.uri | https://hdl.handle.net/20.500.11961/7116 | |
| dc.language.iso | spa | es |
| dc.publisher | Universidad Autónoma de Ciudad Juárez | es |
| dc.relation.ispartof | Doctorado en Ciencias de la Ingeniería Avanzada | es |
| dc.relation.ispartof | Instituto de Ingeniería y Tecnología | es |
| dc.relation.ispartof | Departamento de Ingeniería Eléctrica y Computación | es |
| dc.rights | Attribution-NonCommercial-NoDerivs 2.5 Mexico | en |
| dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/2.5/mx/ | |
| dc.subject | Alta dimensionalidad, big data, desbalance de clases, preprocesamiento de datos, aprendizaje automático. | |
| dc.subject.other | info:eu-repo/classification/cti/7 | |
| dc.subject.secihti | Ingenierias y Desarrollo Tecnológico | |
| dc.title | Método Sistemático para Mitigar el Problema de las Clases No Balanceadas con Alta Dimensionalidad y Solapamiento en Big Data | |
| dc.type | Tesis doctoral | es |
| dc.type | Trabajo de titulación de posgrado | es |
| dcterms.thumbnail | http://ri.uacj.mx/vufind/thumbnails/pi-iit-doctorado.png | es |
Archivos
Bloque original
1 - 1 de 1
Cargando...
- Nombre:
- TesisFinal_ARMANDO ISAAC BOLIVA.pdf
- Tamaño:
- 2.97 MB
- Formato:
- Adobe Portable Document Format