Recursos

Gramàtiques

Desambiguació automàtica de construccions >

Aquest sistema és un recurs dissenyat per desambiguar formalment frases pronominals ambigües i proposa la interpretació semàntica més plausible (passiva, anticausativa, reflexiva, etc.)

 

Esquemes de subcategorització verbals (Espanyol-Català) >

En aquest recurs es poden consultar els llistats d´esquemes de subcategorització general per a la llengua espanyola i catalana extrets dels corpus SenSem respectius. En visualitzar els resultats s´indica la freqüència de l´esquema segons la font utilitzada i la distribució segons textos periodístics o literaris. Els esquemes contenen, per defecte, les categories sintagmàtiques, però l´usuari pot demanar  també la visualització de les funcions sintàctiques i/o semàntiques que hi estan associades, amb les freqüències respectives de cada un d´aquests subesquemes. Per últim, es pot accedir des del patró esquematitzat al llistat d´oracions del corpus que s´hi corresponen.

Aquest recurs es pot descarregar a Descàrregues.

 

Gramàtica HPSG de l’espanyol >

La Spanish Resource Grammar (SRG) és una gramàtica de codi obert de gran cobertura per a l´espanyol. Està basada en el marc teòrio de HPSG i utilitza Minimal Recursion Semantics (MRS) per a la representació semàntica. La SRG està implementada en el sistema Linguistic Knowledge Builder (LKB), a partir dels components bàsics de la gramàtica Matrix del projecte LinGO.

 

Gramàtiques de dependències del català , espanyol i anglès >

EnTxala, EsTxala i CaTxala són gramàtiques de dependències de codi  obert implementades a l´entorn FreeLing, una llibreria d´eines de Processamient del Llenguatge Natural. Aquestes gramàtiques s´han dissenyat com un recurs per a les aplicacions de PLN que requereixen una representació sintàctica profunda i robusta en l´anàlisi automàtic del llenguatge natural. Es tracta de tres gramàtiques d´àmplia cobertura lingüística que proporcionen un únic arbre de dependencies per cada oració d´entrada, per mitjà de l´especificació de les ramificacions de qualsevol estructura sintàctica i l´assignació de funcions sintàctiques a cada arc de l´arbre. Aquests dos processos es duen a terme a través d´un conjunt de regles escrites a mà i basades en coneixement lingüístic (2.954 regles a EnTxala, 4.447 regles a EsTxala i 3.011 regles a CaTxala).

 

ParTes: Test suite per a l’avaluació d’analitzadors sintàctics

ParTes és el primer test suite en català i castellà per a l`avaluació qualitativa d`analitzadors sintàctics. Aquest recurs és una jerarquia de fenòmens representatius en relació amb l`estructura sintàctica i l`ordre d`arguments. ParTes proposa una simplificació de l`avaluació qualitativa per mitjà de l`automatització de les tasques d`avaluació. La versió actual es distribueix amb el mòdul de test suite, en el qual es classifiquen els fenòmens sobre l`estructura sintàctica i els esquemes d`ordre argumental, i el mòdul de dades de test, en el qual estan disponibles la versió en text pla de les dades i la versió anotada en dependències sintàctiques de les dades.

 

Representació semàntica de preguntes (ReSim)

ReSim és un motor que, donada una oració interrogativa, proposa una representació semàntica d´aquesta. La representació es basa en les estructures lèxico-conceptuals de Jackendoff 1990. Aquest sistema s´ha desenvolupat per a un domini restringit.

+ informació