AGENDA

Anonimización Generativa Multimodal y Multilingüe


Reto

La creciente exigencia de proteger los datos personales, especialmente aquellos que permiten identificar directa o indirectamente a una persona, ha convertido la anonimización en una necesidad. Este proyecto responde a esa demanda con una solución tecnológica capaz de anonimizar y seudonimizar información en texto, audio e imagen, cubriendo un total de ocho idiomas (español, inglés, francés, italiano, portugués, catalán, euskera y gallego). Mediante el uso de IA Generativa, esta herramienta automatiza la detección y sustitución de datos sensibles, manteniendo la coherencia y utilidad del contenido original.

La solución aborda un problema crítico en entornos de datos abiertos y entrenamiento de modelos, donde la presencia de rasgos faciales, voz o patrones lingüísticos puede comprometer la identidad de las personas y generar riesgos de incumplimiento del Reglamento General de Protección de Datos (RGPD). El reto consiste en ofrecer una herramienta robusta, escalable y multilingüe que permita identificar, sustituir o eliminar datos personales en diferentes modalidades, reduciendo riesgos legales y facilitando el uso seguro de los datos en entornos de negocio e investigación.

Solución

Esta herramienta es diseñada para integrarse de manera sencilla en diferentes entornos, como los Espacios de Datos. De esta manera, se facilita el uso seguro de la información y el intercambio de datos entre empresas de manera segura y sencilla. La solución se articula en torno a cuatro características principales:

  • Permite anonimizar texto, voz e imagen en cualquier formato audiovisual, cubriendo los distintos puntos en los que pueden aparecer datos personales.

  • Procesa y protege documentos y contenido en diferentes idiomas, garantizando la privacidad de los datos en entornos internacionales.

  • Genera sinónimos y sustituciones coherentes para entidades identificadas, sintetiza voz anonimizada y crea imágenes artificiales que conservan la usabilidad del contenido sin comprometer identidades reales.

  • Facilita la compartición, intercambio o comercialización segura de datos entre empresas e instituciones, asegurando el cumplimiento de la normativa y reduciendo el riesgo en sistemas colaborativos.

Resultados

Se ha desarrollado una herramienta que permite introducir un vídeo, capturar imagen o interactuar mediante voz, anonimizando automáticamente los datos personales presentes en cada modalidad. La solución es capaz de actuar tanto en tiempo real como sobre contenidos previamente almacenados, identificando y transformando información sensible en texto, audio e imagen sin comprometer la coherencia ni la utilidad del material original.

A continuación, se muestra una pequeña demo en español que ilustra el funcionamiento de la herramienta y su capacidad para proteger datos personales de forma integrada, multimodal y automatizada.

Noticias y eventos del proyecto

  • PRÓXIMAMENTE - 25 de marzo de 2026: Fernando Manuel Espinoza Cuadros presentará en Madrid, en el CSIC, un seminario dentro del marco del proyecto, enfocado en “La anonimización de la voz mediante IA Generativa: Retos, técnicas y aplicaciones actuales”. No te lo pierdas.

  • PRÓXIMAMENTE - 24-26 de febrero de 2026: Sigma Cognition se presenta en Málaga, en Transfiere para mostrar la demo del proyecto AGENDA, enfocada en la anonimización de rostro y voz en tiempo real. Véase abajo el folleto oficial presentado en el evento. Anímate a visitarnos en el stand H5.

  • 26-29 de enero de 2026: Evento en Madrid, en la Sociedad Española de Lingüística (SEL) para presentar en el LIV Simposio nuestra investigación sobre “La escritura como identificador: riesgos de reidentificación en textos anonimizados“.

  • 13-15 de enero de 2026: Sigma Cognition asiste al Congreso CIFE, Congreso Internacional de Fonética Experimental, en Córdoba, para hablar sobre “Anonimización de la voz y autorreconocimiento: análisis perceptivo de técnicas de anonimización“.

  • 10-12 de diciembre de 2025: Evento en CILCS 2025, XVII Congreso Internacional Latina de Comunicación Social. Ofrecemos una ponencia sobre “Análisis de la anonimización de la voz y su relevancia en la comunicación social“.

  • 27-28 de noviembre de 2025: Sigma Cognition asiste al Congreso DDHUM, en Braga, para hablar sobre “La alineación entre voz e imagen en un sistema generativo de anonimización multimodal“ y “La exploración del aumento de datos basado en la traducción para la anonimización multilingüe y multimodal“.

  • 29-30 de octubre de 2025: Evento en Techshow en Madrid, en el recinto IFEMA, donde presentamos el proyecto y llevamos una demostración en funcionamiento sobre la anonimización de voz utilizando varias estrategias, incluyendo inteligencia artificial generativa.

  • 23-26 de septiembre de 2025: SIGMA COGNITION asiste al congreso SEPLN2025 en ZARAGOZA y AGENDA se presentará en el evento Tecnoling. Véase abajo el folleto editado para la ocasión.

  • 19 de mayo de 2025: se publica la propuesta de resolución provisional del proyecto AGENDA en la sede electrónica del Ministerio para la Transformación Digital y Función Pública.

  • 31 de enero de 2025: se presenta la solicitud de participación de Sigma Cognition en consorcio con Itelligent.

  • 7 de noviembre de 2024: se publica en el BOE (Boletín Oficial del Estado) la convocatoria con las bases reguladoras para la concesión de ayudas a la financiación de proyectos de Investigación, Desarrollo e Innovación (I+D+i) sobre Espacios de Datos.

Publicaciones

  • Cartel del próximo seminario sobre la voz y la IA Generativa.

  • Cartel del proyecto editado para el evento Transfiere.

  • Resumen de la conferencia presentada en la SEL.

  • Resumen de la conferencia presentada en el CIFE.

  • Artículos presentados en el congreso DDHUM: en imprenta.

  • Resumen de la conferencia presentada en el CILCS.

  • Folleto del proyecto editado para el congreso SEPLN2025.

Socios

Sigma Cognition es el socio principal y colabora (Subcontratación) con la empresa Itelligent, que tiene una experiencia muy contrastada con el desarrollo de tecnologías alrededor de los espacios de datos.

Fondos

Este proyecto recibe fondos del plan de recuperación, transformación y resiliencia de la comunidad europea y es gestionado por la SEDIA (entidad que depende del Ministerio para la transformación digital y de la función pública).

Contacto

Si quieres más información sobre el proyecto y los servicios que ofrecemos, no dudes en contactarnos.

Next
Next

ASVIC