Adaptación de Freeling
La herramienta de Procesamiento del Lenguaje Natural Freeling (Padró 2011) está pensada para el análisis multilingüe, utilizando varios módulos encadenados (tokenizer, splitter, analizador morfológico, etiquetador, desambiguador, etc.) que se sirven tanto de:
- recursos léxicos o vocabularios (de léxico común, de nombres propios, de abreviaturas, de locuciones, etc.), como de
- reglas; ya sean estas
Asimismo, trabaja con un mecanismo de análisis estadístico a partir de un corpus de entrenamiento, utilizado en los procesos de desambiguación de homónimos y en el análisis y etiquetado de formas desconocidas.
En CORHIJE, el proceso de adaptación de Freeling al judeoespañol pasa por crear, modificar, aumentar o eliminar recursos y reglas en los ámbitos señalados; en nuestro caso, a partir de la versión de Freeling para el español, por estar pensada para lidiar con una conjugación verbal rica, clíticos, una morfología derivativa altamente productiva, etc. A ello hay que añadir un innovador sistema de doble lematización (mediante lemas y ARCHILEMAS) para no dejar sin reflejar los fenómenos de variación de carácter sistemático en español sefardí y permitir así proyectarlos sobre los mapas dialectales que se producen al realizar consultas sobre el corpus.