Tesis

La factualidad en las oraciones adversativas, concesivas y condicionales en español: El papel de los tiempos verbales en la anotación automática de corpus (2021)

Autor/a: Leyre Barrios Vicente

Dirección: Gloria Vázquez

En los últimos años, la representación y el análisis de la factualidad de los eventos mencionados en un texto ha experimentado un creciente interés en el ámbito de la lingüística de corpus y en el procesamiento del lenguaje natural. En este ámbito, el proyecto FactBank para el inglés (Saurí y Pustejovsky, 2009) es un claro referente, por lo que la mayoría de los trabajos posteriores se basan en su propuesta de anotación. La presente investigación pretende contribuir al panorama de la anotación de la factualidad para el español, lengua en la que se ha trabajado muy poco en este campo. El objetivo es estudiar la factualidad de las oraciones adversativas, concesivas y condicionales del español y formalizar reglas que permitan determinar los valores factuales para ser implementadas en un anotador automático basado en conocimiento lingüístico. En este sentido cabe remarcar que nuestro trabajo se enmarca dentro del proyecto TAGFACT (2018), cuyo fin es crear una herramienta automática de anotación de la factualidad a partir del análisis de textos periodísticos en español. Cabe mencionar también que, siguiendo la tendencia en la anotación de la factualidad, entendemos esta como el compromiso, por parte del hablante, respecto a la veracidad de una situación. A la hora de especificar este compromiso, nos hemos basado en el análisis de los valores expresados por los tiempos verbales en sí mismos y en los conectores. Según la bibliografía sobre el tema, los valores factuales de los tiempos verbales son, en general, bastantes estables, o bien porque algunos se asocian a un único valor o bien porque otros pueden asociarse a más de un valor, pero puede establecerse el más frecuente. Ciñéndonos a las oraciones objeto de estudio, los resultados obtenidos en esta investigación nos indican que, sobre todo en las oraciones subordinadas (prótasis), algunos tiempos varían el valor por defecto, por lo que, en estos casos, es crucial el papel de los conectores. En este sentido, el análisis revela una escala de complejidad en la que las oraciones adversativas son las que menos problemática presentan y las condicionales las que más. Esto se debe a que, en las oraciones adversativas, los tiempos verbales, salvo en un caso, mantienen los valores factuales por defecto. En cambio, en las oraciones condicionales se ha observado una variación interesante tanto en las subordinadas (o prótasis) como en las principales (o apódosis). En el caso de las concesivas, la complejidad es media, ya que de entre todos los tiempos que presentan las prótasis, cinco de estos tiempos expresan más de un valor factual. Estos resultados nos han permitido formular una serie de reglas específicas para estos tres tipos de oraciones susceptibles de ser implementadas en el anotador automático de TAGFACT y que previsiblemente van a mejorar la precisión de la anotación.

La investigación desarrollada en esta tesis pretende contribuir al panorama de la anotación de la actualidad para el español, lengua en la que se ha trabajado muy poco en este campo. El objetivo es estudiar la actualidad de las oraciones condicionales, concesivas y adversativas del español y formalizar reglas que permitan determinar los valores factuales para ser implementadas en un anotador automático basado en conocimiento lingüístico. En este sentido, cabe remarcar que el trabajo se enmarca dentro del proyecto TAGFACT (Ministerio de Economía, Industria y Competitividad – FFI2017-84008-P).

Siguiendo la tendencia en la anotación de la actualidad, la entendemos como el compromiso, por parte del hablante, respecto a la veracidad de una situación. A la hora de especificar este compromiso, nos hemos basado en el análisis de los valores expresados ​​por los tiempos verbales en sí mismos y en los conectores.

Según la bibliografía sobre el tema, los valores factuales de los tiempos verbales son, por lo general, bastantes estables. Ciñéndonos a las oraciones objeto de estudio, los resultados obtenidos en esta investigación nos indican que, sobre todo en las oraciones subordinadas (prótasis), algunos tiempos varían el valor por defecto, por lo que, en estos casos, es crucial el papel de los conectores. En este sentido, el análisis revela una escala de complejidad en la que las oraciones adversativas son las que menos problemática presentan y las condicionales las que más. Esto se debe a que, en las oraciones adversativas, los tiempos verbales, salvo en un caso, mantienen los valores factuales por defecto. En cambio, en las oraciones condicionales se ha observado una interesante variación tanto en las subordinadas (o prótasis) como en las principales (o apódosis). En el caso de las concesivas, la complejidad es media, ya que de entre todos los tiempos que presentan las prótasis, cinco de ellos expresan más de un valor factual.

PDF