Projectes

Del text al coneixement: factualitat i graus de certesa en espanyol – TAGFACT

L`objectiu general d`aquest projecte és elaborar una representació exhaustiva de la factualitat expressada en textos en espanyol, mitjançant una anàlisi multidimensional, multitextual i multinivell.
L`anàlisi multitextual pretén donar compte de diferents textos sobre el mateix esdeveniment; l`anàlisi multidimensional, d`un nombre molt variat de les veus que avaluen aquest esdeveniment; i el multinivell, de les diferents marques lingüístiques que expressen del punt de vista de l`autor i les seves fonts a nivell morfològic i sintàctic, però també discursiu.
El primer estadi del projecte és, a partir de l`estudi dels elements que intervenen en determinar la factualitat en espanyol, crear una eina d`anotació automàtica dels valors factuals dels esdeveniments expressats en els textos en aquesta llengua (i) que sigui capaç d`identificar les coreferències d`esdeveniments dins d`un text i entre diferents textos, (ii) que pugui identificar les diferents fonts que aporten el seu grau de compromís sobre la certesa dels esdeveniments descrits i (iii) que tingui en compte els marcadors de factualitat a diferents nivells lingüístics a l`hora d`assignar els diferents valors factuals.

El segon estadi és elaborar una representació de la factualitat molt variada i, per tant, molt rica. Aquesta representació ha de permetre no només donar compte dels diferents elements i fonts que intervenen, sinó també aplicar mesures per calcular valors intermedis a partir de les diferents avaluacions dels diferents emissors dels esdeveniments descrits.
Finalment, el tercer estadi és establir el grau d`acostament entre les avaluacions dels lectors (receptors), ja sigui individualment o col·lectivament, i les avaluacions resultants de l`eina d`anotació.
En el nostre projecte ens centrarem en l`estudi de textos corresponents a notícies de l`àmbit polític, i, per tant, els resultats finals del mateix seran crucials sobretot en aquest àmbit.

Finançament:

Ministerio de Economía, Industria y Competitividad – FFI2017-84008-P

Publicacions:

  • Barrios, L., G. Vázquez (2020). “Las oraciones concesivas en español y la factualidad”. Estudios Filológicos, 66, 151-183.
  • Fernández-Montraveta, A., G. Vázquez (2019). “Analysis of the production of pronominal constructions in Spanish in a learner corpus”. Journal of Research Design and Statistics in Linguistics and Communication Science, 5:1-2.
  • Vázquez, G., A. Fernández-Montraveta (2020). “Annotating Factuality in the Tagfact Corpus”. M. Fuster-Márquez, C. Gregori-Signes, J. Santaemilia Ruiz  (eds.),  Multiperspectives in analysis and corpus design. Granada: Comares, pp. 115-125.