Proyectos

Del texto al conocimiento: factualidad y grados de certeza en español – TAGFACT

El objetivo general de este proyecto es elaborar una representación exhaustiva de la factualidad expresada en textos en español, mediante un análisis multidimensional, multitextual y multinivel, con el fin de conseguir un análisis que pueda llevarse a cabo a través de medios automáticos en un grado muy elevado.

El análisis multitextual pretende dar cuenta de distintos textos sobre el mismo evento; el análisis multidimensional, de un número muy variado de las voces que evalúan dicho evento; y el multinivel, de las distintas marcas lingüísticas que expresan del punto de vista del autor y sus fuentes a nivel morfológico y sintáctico, pero también discursivo.

El primer estadio del proyecto es, a partir del estudio de los elementos que intervienen en determinar la factualidad en español, crear una herramienta de anotación de los valores factuales de los eventos expresados en los textos en esta lengua (i) que sea capaz de identificar las correferencias de eventos dentro de un texto y entre distintos textos, (ii) que pueda identificar las distintas fuentes que aportan su grado de compromiso sobre la certeza de los eventos descritos y (iii) que tenga en cuenta los marcadores de factualidad a distintos niveles lingüísticos a la hora de asignar los distintos valores factuales.

El segundo estadio es elaborar una representación de la factualidad muy variada y, por tanto, muy rica. Dicha representación debe permitir no solo dar cuenta de los distintos elementos y fuentes que intervienen en ella, sino también aplicar medidas para calcular valores intermedios a partir de las distintas evaluaciones de los diferentes emisores de los eventos descritos.

Finalmente, el tercer estadio es establecer el grado de acercamiento entre las evaluaciones de los lectores (receptores), ya sea individualmente o colectivamente, y las evaluaciones resultantes de la herramienta de anotación.

En nuestro proyecto nos vamos a centrar en el estudio de textos correspondientes a noticias del ámbito político, y, por tanto, los resultados finales del mismo van a ser cruciales sobre todo en este ámbito.

Financiación:

Ministerio de Economía, Industria y Competitividad – FFI2017-84008-P

  • Barrios, L., G. Vázquez (2020). “Las oraciones concesivas en español y la factualidad”. Estudios Filológicos, 66, 151-183.
  • Fernández-Montraveta, A., G. Vázquez (2019). “Analysis of the production of pronominal constructions in Spanish in a learner corpus”. Journal of Research Design and Statistics in Linguistics and Communication Science, 5:1-2.
  • Vázquez, G., A. Fernández-Montraveta (2020). “Annotating Factuality in the Tagfact Corpus”. M. Fuster-Márquez, C. Gregori-Signes, J. Santaemilia Ruiz  (eds.),  Multiperspectives in analysis and corpus design. Granada: Comares, pp. 115-125.