Recursos

Gramáticas

Desambiguación automática de construcciones >

Este sistema es un recurso diseñado para desambiguar formalmente frases pronominales ambiguas y propone la interpretación semántica más plausible (pasiva, anticausativa, reflexiva, etc.)

 

Esquemas de subcategorización verbales (Español-Catalán) >

En este recurso se pueden consultar el listado de esquemas de subcategorización general para la lengua española y catalana extraidos de los corpus SenSem respectivos. Al visualizar los resultados se indica la frecuencia del esquema según la fuenta utilizada y la distribución según textos periodísticos o literarios. Los esquemas contienen, por defecto, las categorías sintagmáticas, pero el usuario puede solicitar también la visualización de las funciones sintácticas y/o semánticas que están asociadas a dichas categorías, con las frecuencias respectivas de cada uno de estos subesquemas. Por último, se puede acceder desde el patrón esquematizado al listado de oraciones del corpus que se corresponden a dicho patrón.
Este recurso se puede descargar en «Descargas».

 

Gramática HPSG del español >

La Spanish Resource Grammar (SRG) es una gramática de código abierto de ámplia cobertura para el español.Está basada en el marco teórico de HPSG y utiliza Minimal Recursion Semantics (MRS) para la representación semántica. La SRG está implementada en el sistema Linguistic Knowledge Builder (LKB), basándose en los componentes básicos de la gramática Matrix del proyecto LinGO.

 

Gramáticas de dependencias del catalán, español y inglés >

EnTxala, EsTxala y CaTxala son gramáticas de dependencias de código abierto implementadas en el entorno FreeLing, una librería de herramientas de Procesamiento del Lenguaje Natural. Estas gramáticas se han diseñado como un recurso para las aplicaciones de PLN que requieren una representación sintáctica profunda y robusta en el análisis automático del lenguaje natural. Se trata de tres gramáticas de amplia cobertura lingüística que proporcionan un único árbol de dependencias para cada oración de entrada, mediante la especificación de ramificación de cualquier estructura sintáctica y la asignación de funciones sintácticas a cada arco del árbol. Ambos procesos se lleban a cabo a través de un conjunto de reglas escritas a mano y basadas en conocimiento lingüístico (2.954 reglas en EnTxala, 4.447 reglas en EsTxala y 3.011 reglas en CaTxala).

 

ParTes: Test suite para evaluación de analizadores sintácticos >

ParTes es el primer test suite en español y catalán para la evaluación cualitativa de analizadores sintácticos. Este recurso es una jerarquía de los fenómenos representativos acerca de la estructura sintáctica y el orden de argumentos. ParTes propone una simplificación de la evaluación cualitativa contribuyendo a la automatización de esta tarea. La versión actual se distribuye con el módulo de test suite, donde se clasifican los fenómenos sobre estructura sintáctica y los esquemas de orden de argumentos, y el módulo de datos de test, donde están disponibles la versión en texto plano de los datos y la versión anotada en dependencias sintácticas de los datos.

 

Representación semántica de preguntas (ReSim) >

ReSim es un motor que, dada un oración interrogativa, propone una representación semántica de la misma. La representación se basa en las estructuras léxico- conceptuales de Jackendoff 1990. Este sistema se ha desarrollado para un dominio restringido.

+ información