Desarrollo de técnicas para el preprocesamiento y la predicción de problemas de clasificación multietiqueta
Resumen
Introducción: La clasificación multietiqueta es una variante de la clasificación tradicional de etiqueta única, en la que un objeto ya no se clasifica exclusivamente por una etiqueta. En su lugar, este aprendizaje pretende asignar a un objeto una o más clases de etiquetas de un conjunto predefinido de clases. Dado que el aprendizaje multietiqueta se encuentra todavÃa en una fase temprana de desarrollo, en comparación con otras técnicas de clasificación, algunas técnicas actualmente disponibles para otros tipos de aprendizaje no se han desarrollado para este caso especÃfico.
Métodos: Tras un estudio de la literatura existente, los siguientes son algunos de los retos de investigación dentro de esta temática: medidas de calidad de los datos, métodos de reducción sobre conjuntos de datos multietiqueta, métodos de detección de valores atÃpicos, capas de agrupación para datos multietiqueta sin una organización topológica, métodos para tratar problemas de clasificación multietiqueta con caracterÃsticas dispersas y técnicas de inteligencia artificial explicable para clasificadores neuronales multietiqueta.
Resultados: Se proponen: a) Medidas de calidad de los datos multietiqueta (3); b) Métodos para reducir conjuntos de datos multietiqueta (6); c) Método que mide el grado de anomalÃa de un objeto en conjuntos de datos multietiqueta (1); d) Arquitectura neuronal profunda que utiliza capas de agrupación basadas en la asociación bidireccional (1); e) Sistema neuronal para resolver problemas de clasificación multietiqueta descritos por datos tabulares que pueden implicar caracterÃsticas dispersas (1) y f) Adaptación al escenario multietiqueta de una técnica clásica de interpretabilidad post-hoc en redes neuronales (1). Conclusiones, los métodos propuestos le proporcionan a la comunidad cientÃfica novedosas técnicas de clasificación multietiqueta, haciendo posible un proceso de descubrimiento de conocimiento más eficiente y eficaz sobre datos multietiqueta.
Palabras clave
Copyright (c) 2023 Marilyn Bello GarcÃa
Esta obra está bajo una licencia de Creative Commons Reconocimiento-NoComercial 4.0 Internacional.