Agréganos como tu fuente favorita en Google
Agrega Revista Selecciones México en

Dos estudios liderados por la Universidad Politécnica de Madrid (UPM) muestran cómo se pueden generar datos sintéticos fiables cuando los datos reales escasean, algo que podría tener aplicaciones directas en la investigación oncológica.

De acuerdo con lo que explica la instancia educativa, la inteligencia artificial necesita datos para aprender. Sin embargo, en medicina esos datos suelen ser escasos, heterogéneos y difíciles de compartir por razones éticas, legales y de privacidad.



Te puede interesar: Esperamos que si tienes 40 (o más) hayas dejado de creer estas cosas

El problema es especialmente acusado en ámbitos como el cáncer, las enfermedades raras o los estudios de supervivencia, donde reunir grandes colecciones de pacientes no siempre es posible.

En ese contexto, un equipo de la UPM ha desarrollado dos trabajos complementarios para mejorar la generación de datos sintéticos, es decir, registros artificiales que reproducen patrones estadísticos de los datos reales sin copiar pacientes concretos.

Con base en los resultados obtenidos, los autores subrayan una idea relevante para el futuro de la inteligencia artificial médica. No basta con comprobar si los datos sintéticos sirven para entrenar un modelo en una tarea concreta; también es necesario medir hasta qué punto se parecen realmente a los datos originales y si conservan relaciones complejas entre variables.

Por eso, ambos trabajos insisten en la necesidad de combinar métricas de utilidad con métricas de similitud, lo que permite validar mejor la calidad real del dato sintético.

datos sintéticos fiables
El primero de los estudios fue publicado en la revista Neurocomputing y plantea una metodología para que los modelos generativos aprendan mejor con pocos ejemplos reales.

El primero de los estudios fue publicado en la revista Neurocomputing y plantea una metodología para que los modelos generativos aprendan mejor con pocos ejemplos reales. Siendo la clave el introducir un sesgo inductivo artificial, una especie de guía matemática previa que orienta al modelo en un escenario con muy pocos datos.



Para lograrlo, los investigadores combinaron técnicas de transferencia de aprendizaje y de metaaprendizaje, además de que compararon varias estrategias, como el preentrenamiento, el promedio de modelos, el denominado Model-Agnostic Meta-Learning (MAML) y el Domain Randomized Search (DRS).

Los resultados muestran que, en general, las estrategias y transferencia de aprendizaje ofrecieron el mejor desempeño y mejoraron de manera muy notable la calidad de los datos sintéticos generados. En algunos experimentos la mejora alcanzó hasta un 60% en la divergencia de Jensen-Shannon, una métrica que permite estimar hasta qué punto la distribución de los datos sintéticos se asemeja a la de los datos reales.

Segundo estudio

El segundo estudio fue publicado en el IEEE Journal of Biomedical and Health Informatics y en él se traslada esa metodología al ámbito biomédico y la pone a prueba en investigación oncológica y en análisis de supervivencia.

Este tipo de análisis permite estimar el tiempo hasta que ocurre un evento clínico relevante, por ejemplo, una recaída, una progresión de la enfermedad o el fallecimiento, y es especialmente sensible a la falta de datos.

El trabajo muestra que la metodología también resulta útil en este complejo contexto y ayuda a generar datos sintéticos de alta calidad incluso en condiciones muy restrictivas.

Las implicaciones de esta línea de investigación son amplias y, en opinión de Patricia Alonso, investigadora de la UPM, disponer de datos sintéticos fiables puede, por un lado, facilitar el desarrollo y la validación de herramientas de inteligencia artificial en hospitales y centros de investigación con escasos datos y, por otro, favorecer estudios en cohortes pequeñas, así como también abrir nuevas vías de colaboración y de ciencia abierta sin comprometer la privacidad de pacientes.

También te puede interesar: CBD: La dosis clave y los 5 beneficios que debes conocer en 2025



Agréganos como tu fuente favorita en Google
Agrega Revista Selecciones México en



Licenciado en Comunicación por la Facultad de Estudios Superiores Acatlán, se desempeña en la redacción de notas y contenidos informativos sobre turismo, salud, tecnología y otros temas de interés general. MÁS DEL AUTOR

RECOMENDADO