Desarrollo de técnicas para el preprocesamiento y la predicción de problemas de clasificación multietiqueta
Palabras clave:
clasificación multietiqueta, caracterización de los datos, preprocesamiento de los datos, proceso de aprendizaje, inteligencia artificial explicableResumen
Introducción: La clasificación multietiqueta es una variante de la clasificación tradicional de etiqueta única, en la que un objeto ya no se clasifica exclusivamente por una etiqueta. En su lugar, este aprendizaje pretende asignar a un objeto una o más clases de etiquetas de un conjunto predefinido de clases. Dado que el aprendizaje multietiqueta se encuentra todavía en una fase temprana de desarrollo, en comparación con otras técnicas de clasificación, algunas técnicas actualmente disponibles para otros tipos de aprendizaje no se han desarrollado para este caso específico.
Métodos: Tras un estudio de la literatura existente, los siguientes son algunos de los retos de investigación dentro de esta temática: medidas de calidad de los datos, métodos de reducción sobre conjuntos de datos multietiqueta, métodos de detección de valores atípicos, capas de agrupación para datos multietiqueta sin una organización topológica, métodos para tratar problemas de clasificación multietiqueta con características dispersas y técnicas de inteligencia artificial explicable para clasificadores neuronales multietiqueta.
Resultados: Se proponen: a) Medidas de calidad de los datos multietiqueta (3); b) Métodos para reducir conjuntos de datos multietiqueta (6); c) Método que mide el grado de anomalía de un objeto en conjuntos de datos multietiqueta (1); d) Arquitectura neuronal profunda que utiliza capas de agrupación basadas en la asociación bidireccional (1); e) Sistema neuronal para resolver problemas de clasificación multietiqueta descritos por datos tabulares que pueden implicar características dispersas (1) y f) Adaptación al escenario multietiqueta de una técnica clásica de interpretabilidad post-hoc en redes neuronales (1). Conclusiones, los métodos propuestos le proporcionan a la comunidad científica novedosas técnicas de clasificación multietiqueta, haciendo posible un proceso de descubrimiento de conocimiento más eficiente y eficaz sobre datos multietiqueta.
Descargas
Publicado
Cómo citar
Número
Sección
Licencia
La revista Anales de la Academia de Ciencias de Cuba protege los derechos de autor, y opera con una Licencia Creative Commons 4.0 (Licencia Creative Commons Reconocimiento-NoComerciall 4.0). Al publicar en ella los autores permiten copiar, reproducir, distribuir, comunicar públicamente su obra y generar obras derivadas, siempre y cuando se cite y reconozca al autor original. No permiten, sin embargo, utilizar la obra original con fines comerciales ni lucrativos.
Los autores autorizan la publicación de sus escritos conservando los derechos de autoría, y cediendo y transfiriendo a la revista todos los derechos protegidos por las leyes de propiedad intelectual que rigen en Cuba, que implican la edición para difundir la obra.
Los autores podrán establecer acuerdos adicionales para la distribución no exclusiva de la versión de la obra publicada en la revista (por ejemplo, situarla en un repositorio institucional o publicarla en un libro), con el reconocimiento de haber sido publicada primero en esta revista.
Para conocer más, véase https://creativecommons.org