Projectes
Del text al coneixement: factualitat i graus de certesa en espanyol – TAGFACT
L`objectiu general d`aquest projecte és elaborar una representació exhaustiva de la factualitat expressada en textos en espanyol, mitjançant una anàlisi multidimensional, multitextual i multinivell.
L`anàlisi multitextual pretén donar compte de diferents textos sobre el mateix esdeveniment; l`anàlisi multidimensional, d`un nombre molt variat de les veus que avaluen aquest esdeveniment; i el multinivell, de les diferents marques lingüístiques que expressen del punt de vista de l`autor i les seves fonts a nivell morfològic i sintàctic, però també discursiu.
El primer estadi del projecte és, a partir de l`estudi dels elements que intervenen en determinar la factualitat en espanyol, crear una eina d`anotació automàtica dels valors factuals dels esdeveniments expressats en els textos en aquesta llengua (i) que sigui capaç d`identificar les coreferències d`esdeveniments dins d`un text i entre diferents textos, (ii) que pugui identificar les diferents fonts que aporten el seu grau de compromís sobre la certesa dels esdeveniments descrits i (iii) que tingui en compte els marcadors de factualitat a diferents nivells lingüístics a l`hora d`assignar els diferents valors factuals.
El segon estadi és elaborar una representació de la factualitat molt variada i, per tant, molt rica. Aquesta representació ha de permetre no només donar compte dels diferents elements i fonts que intervenen, sinó també aplicar mesures per calcular valors intermedis a partir de les diferents avaluacions dels diferents emissors dels esdeveniments descrits.
Finalment, el tercer estadi és establir el grau d`acostament entre les avaluacions dels lectors (receptors), ja sigui individualment o col·lectivament, i les avaluacions resultants de l`eina d`anotació.
En el nostre projecte ens centrarem en l`estudi de textos corresponents a notícies de l`àmbit polític, i, per tant, els resultats finals del mateix seran crucials sobretot en aquest àmbit.
Finançament:
Ministerio de Economía, Industria y Competitividad – FFI2017-84008-P
Publicacions:
- Alonso, L., I. Castellón, H, Curell, A. Fernández-Montraveta, S. Oliver, G. Vázquez (2018). “Proyecto TAGFACT: Del texto al conocimiento. Factualidad y grados de certeza en español”, Procesamiento del Lenguaje Natural, 61, p. 151-154. ISSN: 1135-5948
- Barrios, L., G. Vázquez (2020). “Las oraciones concesivas en español y la factualidad”. Estudios Filológicos, 66, 151-183.
- Fernández-Montraveta, A., G. Vázquez (2019). “Analysis of the production of pronominal constructions in Spanish in a learner corpus”. Journal of Research Design and Statistics in Linguistics and Communication Science, 5:1-2.
- Fernández-Montraveta, A. H. Curell, G. Vázquez, I. Castellón (2020). “The TAGFACT annotator and editor: A versatile tool”. Research in Corpus Linguistics, 8:1, 131-146.
- Rosá, A., I. Castellón, I., L. Chiruzzo, H. Curell, M. Etcheverry, A. Fernández, G. Vázquez, D. Wonsever (2019). “Overview of FACT at IberLEF 2019. Factuality Analysis and Classification Task”. Proceedings of the Iberian Languages Evaluation Forum (IberLEF 2019) Co-located with 35th Conference of the Spanish Society for Natural Language Processing (SEPLN 2019). Bilbao.
- Rosá, A., L. Alonso, I. Castellón, L. Chiruzzo, H. Curell, A. Fernández-Montraveta, S. Góngora, M. Malcouri, G. Vázquez, D. Wonsever (2020). “Overview of FACT at IBERLEF 2020: Events detection and classification”. IBERLEF-FACT. Universidad de Málaga.
- Vázquez, G., A. Fernández-Montraveta (2020). “Annotating Factuality in the Tagfact Corpus”. M. Fuster-Márquez, C. Gregori-Signes, J. Santaemilia Ruiz (eds.), Multiperspectives in analysis and corpus design. Granada: Comares, pp. 115-125.