Proyecto ROBOT-TALK
Reconocimiento del origen robótico de textos. Automatización de tareas y conocimiento lingüístico
Proyecto PID2022-140897OB-I00 financiado por MICIU/AEI /10.13039/501100011033/ y por FEDER Una manera de hacer Europa
sepiembre 2023-2026
Go to the English version
ROBOT-TALK es un proyecto multidisciplinar de investigación aplicada orientado a la transición digital para determinar de manera semiautomática si los textos digitales “han sido elaborados sin intervención humana mediante procesos automatizados” (cap. XV.2 Carta Derechos Digitales, 2021). Se trata, básicamente, de realizar un “Test de Turing” a los textos digitales (Turing, 1950). Sus resultados ayudarán a garantizar el derecho a recibir información veraz (Carta Derechos Digitales, 2021), y a asegurar la transparencia de la información. Asimismo, el proyecto contribuirá a la generación de conocimiento científico en lingüística forense y lingüística computacional con aplicaciones en ciberseguridad al detectar si detrás de un texto está un agente humano o una máquina.
El objetivo del proyecto es definir una metodología sustentada en conocimiento lingüístico para detectar textos generados automáticamente (robots) en español con el fin de ayudar a mejorar los enfoques actuales de identificación y clasificación de textos generados automáticamente. Nuestra hipótesis es que es posible, aplicando métodos de la Lingüística forense, obtener el idiolecto (firma lingüística) del autor de un texto anónimo mediante un análisis/perfilado lingüístico, sea un humano o sea una máquina. Para el logro del objetivo se ha desgranado en seis objetivos específicos que son:
- La creación de un corpus (comparable) de textos generados persona-máquina
- El estudio de las capacidades/conocimientos lingüísticos de los LLM generativos (llamamos robots)
- El análisis de las fortalezas y debilidades de los métodos de la Lingüística forense para la caracterización e identificación de autoría robótica
- El análisis de las fortalezas y debilidades de los sistemas automáticos actuales de identificación de textos robóticos aplicados al español
- La elaboración de una propuesta metodológica para la identificación de la autoría robótica de textos
- Realización de una prueba de concepto para verificar la eficacia de la propuesta