Una nueva técnica optimiza la clasificación de datos en inteligencia artificial para el diagnóstico de cáncer y otras aplicaciones

  • El estudio, realizado por la Universidad Complutense de Madrid en colaboración con las universidades chilenas de Los Andes y Diego Portales, utiliza técnicas matemáticas avanzadas para eliminar datos poco relevantes, haciendo que los modelos sean más rápidos y robustos
  • Esta metodología, especialmente útil en biomedicina para predecir el riesgo de cáncer, también tiene aplicaciones en detección de fraudes o análisis de redes sociales, entre otras

 

Esta técnica permite clasificar mejor la información de los pacientes. / Shutterstock.

Esta técnica permite clasificar mejor la información de los pacientes. / Shutterstock.

UCC-UCM, 6 de marzo de 2025. Una investigación liderada por la Universidad Complutense de Madrid (UCM), en colaboración con las universidades chilenas de Los Andes y Diego Portales, demuestra, a través de técnicas matemáticas avanzadas, cómo mejorar la precisión y eficiencia de los modelos de inteligencia artificial (IA) para clasificar casos de manera más fiable seleccionando los mejores datos.

Esto permite a la IA analizar nueva información y clasificarla correctamente, por ejemplo, determinando si un paciente tiene alto riesgo de cáncer o si una transacción bancaria es fraudulenta.

El trabajo, publicado en Pattern Recognition, logra eliminar datos poco relevantes sin comprometer la calidad de las predicciones, lo que permite que los modelos sean más rápidos, interpretables y robustos ante variaciones en los datos.

A diferencia de otros enfoques, señalan los investigadores, el trabajo integra directamente la selección de datos relevantes dentro del proceso de aprendizaje del modelo, en lugar de hacerlo como un paso separado. Esto permite que la IA aprenda no solo a clasificar con precisión, sino también a identificar automáticamente qué datos son realmente importantes.

“Esto significa que la IA puede tomar decisiones más precisas incluso cuando los datos contienen ruido o están incompletos, mejorando su aplicabilidad en situaciones del mundo real. Por ejemplo, en el diagnóstico de cáncer, esto facilita la identificación de biomarcadores clave en pruebas médicas, permitiendo una detección más temprana y precisa de la enfermedad”, explica Benjamín Ivorra, catedrático del Grupo MOMAT del Instituto de Matemática Interdisciplinar (IMI) de la UCM.

Los resultados de esta investigación son especialmente útiles en problemas de clasificación, donde es crucial identificar con precisión a qué categoría pertenece un caso analizado.

“En el campo de la salud, nuestros métodos pueden mejorar la clasificación de pacientes en función de su riesgo de padecer cáncer, a partir del análisis de datos genéticos e imágenes médicas, permitiendo diagnósticos más precisos y con menor coste computacional”, destaca Ángel Manuel Ramos, también catedrático en el grupo MOMAT del IMI.

Un abanico de aplicaciones

“Nuestros resultados pueden aplicarse en muchos otros ámbitos además de la biomedicina", explica Miguel Carrasco, catedrático en la Universidad de los Andes. Por ejemplo, en la detección de fraudes financieros, donde la IA debe distinguir entre transacciones legítimas y sospechosas, o en la optimización de motores de recomendación, ayudando a personalizar productos o contenidos según las preferencias de los usuarios.

“También pueden utilizarse en la clasificación de grandes volúmenes de información en redes sociales, en ciberseguridad para detectar accesos no autorizados o incluso en la gestión de recursos naturales, como la identificación de especies en la pesca para evitar la sobreexplotación", añade el investigador.

Durante un año y medio, se ha realizado un análisis computacional que ha permitido probar la eficacia de los nuevos algoritmos en grandes volúmenes de datos a través de datos biomédicos utilizados para el diagnóstico de enfermedades como el cáncer.

Sobre los siguientes pasos en la investigación, los expertos avanzan que en la actualidad están aplicando el modelo a la detección de cáncer de próstata, explorando cómo mejorar la precisión de los diagnósticos mediante modelos de IA más avanzados.

“Otra línea de investigación del grupo se centra en la aplicación de IA para el diseño mejorado de placas solares, optimizando su estructura y rendimiento. Estas investigaciones buscan no solo mejorar la precisión y eficiencia de la clasificación en distintos ámbitos, sino también expandir el impacto de la inteligencia artificial en la medicina, la energía renovable y otras áreas clave”, concluye Julio López, profesor en la Universidad Diego Portales.

 

Referencia bibliográfica: Miguel Carrasco, Benjamin Ivorra, Julio López, Angel M. Ramos, “Embedded feature selection for robust probability learning machines”, Pattern Recognition, Volume 159, 2025, 111157, ISSN 0031-3203. DOI: 10.1016/j.patcog.2024.111157.

 

 


 

      
Unidad de Cultura Científica y de la Innovación
Oficina de Transferencia de Resultados de Investigación (OTRI)
Universidad Complutense de Madrid 
uccucm@ucm.es 
 
 
 

Con la colaboración de: