Grupos de investigación

Corpus COLHACH

Corpus de Lengua Hablada en Chino

El Corpus de Lengua Hablada en Chino (COLHACH) es un corpus oral compuesto por 24 conversaciones coloquiales en chino mandarín actual. Creado por Li Yue (doctoranda en el programa “Lingüística Teórica y Aplicada” de la UCM), dicho corpus tiene el objetivo de ofrecer a los investigadores un acceso disponible y gratuito de lengua china hablada. Se compone de 24 conversaciones espontáneas de 20-35 minutos cada una, con un número de hablantes entre 2-7, jóvenes universitarios y de edad inferior a 35 años, recogidas entre noviembre de 2018 - abril de 2019. Los lugares de grabación son restaurantes-cafeterías, domicilios particulares y universidades. En suma, el COLHACH tiene 278,559 caracteres, 10,361 intervenciones y una duración total de 8:29:24 horas, transcrito en pinyin para facilitar la pronunciación y el entendimiento del chino. Se aplica el sistema de transcripción del Grupo Val.Es.Co. (https://www.uv.es/valesco/sistema.pdf).