Adaptación de Freeling

La herramienta de Procesamiento del Lenguaje Natural Freeling (Padró 2011) está pensada para el análisis multilingüe, utilizando varios módulos encadenados (tokenizer, splitter, analizador morfológico, etiquetador, desambiguador, etc.) que se sirven tanto de:

  • recursos léxicos o vocabularios (de léxico común, de nombres propios, de abreviaturas, de locuciones, etc.), como de
  •  
  • reglas; ya sean estas
- reglas de segmentación textual (que le indican a Freeling qué es una frase o una palabra), o
- reglas lingüísticas (clíticos, derivación, terminaciones verbales, etc.).

Asimismo, trabaja con un mecanismo de análisis estadístico a partir de un corpus de entrenamiento, utilizado en los procesos de desambiguación de homónimos y en el análisis y etiquetado de formas desconocidas.


En CORHIJE, el proceso de adaptación de Freeling al judeoespañol pasa por crear, modificar, aumentar o eliminar recursos y reglas en los ámbitos señalados; en nuestro caso, a partir de la versión de Freeling para el español, por estar pensada para lidiar con una conjugación verbal rica, clíticos, una morfología derivativa altamente productiva, etc. A ello hay que añadir un innovador sistema de doble lematización (mediante lemas y ARCHILEMAS) para no dejar sin reflejar los fenómenos de variación de carácter sistemático en español sefardí y permitir así proyectarlos sobre los mapas dialectales que se producen al realizar consultas sobre el corpus.