Proyectos
Del texto al conocimiento: factualidad y grados de certeza en español – TAGFACT
El análisis multitextual pretende dar cuenta de distintos textos sobre el mismo evento; el análisis multidimensional, de un número muy variado de las voces que evalúan dicho evento; y el multinivel, de las distintas marcas lingüísticas que expresan del punto de vista del autor y sus fuentes a nivel morfológico y sintáctico, pero también discursivo.
El primer estadio del proyecto es, a partir del estudio de los elementos que intervienen en determinar la factualidad en español, crear una herramienta de anotación de los valores factuales de los eventos expresados en los textos en esta lengua (i) que sea capaz de identificar las correferencias de eventos dentro de un texto y entre distintos textos, (ii) que pueda identificar las distintas fuentes que aportan su grado de compromiso sobre la certeza de los eventos descritos y (iii) que tenga en cuenta los marcadores de factualidad a distintos niveles lingüísticos a la hora de asignar los distintos valores factuales.
El segundo estadio es elaborar una representación de la factualidad muy variada y, por tanto, muy rica. Dicha representación debe permitir no solo dar cuenta de los distintos elementos y fuentes que intervienen en ella, sino también aplicar medidas para calcular valores intermedios a partir de las distintas evaluaciones de los diferentes emisores de los eventos descritos.
Finalmente, el tercer estadio es establecer el grado de acercamiento entre las evaluaciones de los lectores (receptores), ya sea individualmente o colectivamente, y las evaluaciones resultantes de la herramienta de anotación.
En nuestro proyecto nos vamos a centrar en el estudio de textos correspondientes a noticias del ámbito político, y, por tanto, los resultados finales del mismo van a ser cruciales sobre todo en este ámbito.
Financiación:
Ministerio de Economía, Industria y Competitividad – FFI2017-84008-P
- Alonso, L., I. Castellón, H, Curell, A. Fernández-Montraveta, S. Oliver, G. Vázquez (2018). “Proyecto TAGFACT: Del texto al conocimiento. Factualidad y grados de certeza en español”, Procesamiento del Lenguaje Natural, 61, p. 151-154. ISSN: 1135-5948
- Barrios, L., G. Vázquez (2020). “Las oraciones concesivas en español y la factualidad”. Estudios Filológicos, 66, 151-183.
- Fernández-Montraveta, A., G. Vázquez (2019). “Analysis of the production of pronominal constructions in Spanish in a learner corpus”. Journal of Research Design and Statistics in Linguistics and Communication Science, 5:1-2.
- Fernández-Montraveta, A. H. Curell, G. Vázquez, I. Castellón (2020). “The TAGFACT annotator and editor: A versatile tool”. Research in Corpus Linguistics, 8:1, 131-146.
- Rosá, A., I. Castellón, I., L. Chiruzzo, H. Curell, M. Etcheverry, A. Fernández, G. Vázquez, D. Wonsever (2019). “Overview of FACT at IberLEF 2019. Factuality Analysis and Classification Task”. Proceedings of the Iberian Languages Evaluation Forum (IberLEF 2019) Co-located with 35th Conference of the Spanish Society for Natural Language Processing (SEPLN 2019). Bilbao.
- Rosá, A., L. Alonso, I. Castellón, L. Chiruzzo, H. Curell, A. Fernández-Montraveta, S. Góngora, M. Malcouri, G. Vázquez, D. Wonsever (2020). “Overview of FACT at IBERLEF 2020: Events detection and classification”. IBERLEF-FACT. Universidad de Málaga.
- Vázquez, G., A. Fernández-Montraveta (2020). “Annotating Factuality in the Tagfact Corpus”. M. Fuster-Márquez, C. Gregori-Signes, J. Santaemilia Ruiz (eds.), Multiperspectives in analysis and corpus design. Granada: Comares, pp. 115-125.