viernes, 11 de junio de 2010

Lingüística computacional (VIII)


(El capítulo anterior de esta serie puede verse aquí)


Gramática Sintagmática nuclear

     Este modelo de gramática, desarrollado por el profesor Pollard (arriba en la foto), recibe en inglés el nombre de HPSG o Head-driven Phrase Structure Grammar. Se trata de una gramática de unificación basada en estructuras de rasgos (ver capítulos anteriores si se requiere recordar estos conceptos) los cuales se eligen de entre un conjunto amplio y bien categorizado de rasgos y valores. La gramática HPSG parte de la estructura superficial de la oración y, por tanto, no necesita apelar a ninguna estructura profunda y no es transformacional. Hoy en día, este formalismo es el más extendido en las aplicaciones computacionales. De hecho, puede decirse que HPSG es más una técnica computacional de plasmar una gramática que un modelo teórico de lenguaje.

     Un importante concepto de esta gramática es que define el signo , una colección de información representada como una estructura rígida y determinada que se aplica a todos las posibles palabras o categorías. Las palabras, los sintagmas, las oraciones, comparten un único modelo de signo perfectamente estructurado en el que ciertos atributos están o no presentes según el tipo que sea. Este signo es una matriz de rasgos que incluye siempre, al menos, dos atributos llamados PHON, que describe la fonética del signo, y SYNSEM que incorpora toda la información sintáctica y semántica. Este atributo SYNSEM se desglosa posteriormente en otra serie de atributos también perfectamente definidos. En la gramática sintagmática nuclear, un atributo puede tener como valor una estructura de rasgos compleja ordenada o desordenada. Pero cualquiera que sea, pertenecerán a unos tipos determinados y estandarizados. Si el signo se aplica a una palabra incluye el subtipo word. Si se aplica a una frase, recibe el subtipo phrase o frasal.

     Es ya obvio que esta estandarización del rasgo tiene ventajas indudables para la programación. Los algoritmos que deban manejar la gramática se encontrarán con un objeto conocido y manejable. Que este objeto describa el lenguaje más o menos correctamente no es tan importante. Lo fundamental es que es tratable de manera eficiente por un ordenador. Una ventaja adicional es que HPSG puede utilizarse tanto para analizar la sintaxis de un lenguaje como para generarlo.

     A diferencia de las gramáticas transformacionales, HPSG defiende que las estructuras idiomáticas se forman mediante las operaciones de unificación y subsunción que vimos en capítulos anteriores. Asimismo, esta gramática entiende las reglas como restrictivas, es decir una regla señala las restricciones que han de existir al combinar palabras o sintagmas pero no define el orden concreto en que estos constituyentes deben aparecer.


Representación del conocimiento


    En HPSG se representa la estructura lingüística mediante matrices de rasgos (o AVM, Attribute Value Matrix). La siguiente figura muestra un ejemplo (no completo) de formato de esta matriz:



    Las palabras clave en mayúsculas son los atributos del rasgo. A su lado, se indican los tipos de valores que pueden tomar dichos atributos.

     Los atributos pueden desplegarse con más palabras clave:


    Cuando esta matriz describe un sintagma se usan ciertos atributos. Cuando describe una palabra, apareen otros o algunos de ellos pueden quedar inactivos como, por ejemplo, NONLOC y QSTORE en el caso anterior.

    Cuando existe una estructura compartida se utiliza la misma notación (un número dentro de un cuadrado) que ya vimos en capítulos anteriores.

   Veamos, por ejemplo, la matriz para algunas palabras en inglés y castellano:











     Un elemento importante que cuelga de SYNSEM es la característica HEAD que, por sí misma, es otra matriz completa de atributos . O información sobre el especificador SPR o el complemento COMP. Por ejemplo:



     En HSPG se distingue ente núcleos sustanciales y núcleos funcionales. Los primeros contribuyen sustancialmente a las semántica de los signos en los que están incluidos (equivale a las categorías mayores en otras gramáticas). Las categorías sustanciales incluyen siempre dos rasgos particulares: MOD (que expresa la modificación entre núcleo y adjunto) y PRD (predicativo).

   Los núcleos funcionales pueden ser determinantes (artículos, etc) o marcadores (comparativos, completivos, etc).

   Los signos para sintagmas incluyen el atributo DTRS (Daugthers features)que sirve para representar la estructura de constituyentes hijos del sintagma:



    Este signo se suele descomponer en diferentes tipos de “hijos” como HEADS, COMPS, SPECS y ADJUNTOS. Una matriz de este tipo puede ser:



Seguir leyendo aquí.

Entrada publicada por Félix Remírez en Biblumliteraria


Share/Save/Bookmark

No hay comentarios:

Publicar un comentario

Related Posts Plugin for WordPress, Blogger...