XIADA: Etiquetador/Lematizador do Galego Actual

XIADA

Data de actualización: 11/4/2019
Versión: 2.7

O Centro Ramón Piñeiro para a investigación en humanidades inclúe entre os seus obxectivos fundacionais o desenvolvemento de recursos informáticos que axuden á incorporación da lingua galega ao mundo das novas tecnoloxías.

Con esta premisa desenvólvese XIADA, un etiquetador estatístico de alta precisión que empregamos para etiquetar e lematizar automaticamente os documentos do Corpus de Referencia do Galego Actual (CORGA), e poder así dar un salto cualitativo na recuperación de información formulando consultas que utilizan información gramatical (etiquetas, lemas, clases de palabras, trazos morfosintácticos etc.).

Nesta páxina póñense á súa disposición:

 1. os recursos que emprega o etiquetador:
  • corpus de adestramento (descarga)
  • léxico (descarga)
  • etiquetario e exemplos de uso
 2. o propio etiquetador:
  • demostración en liña
  • código (descarga)