Corpus de Referencia do Galego Actual

Ata o momento incorporáronse ao CORGA 630 xornais (exemplares completos d’A Nosa Terra, A Peneira, De Luns a Venres, Diario Oficial de Galicia, Galicia Hoxe, O Correo Galego, O Xornal de Galicia e Sermos Galiza e noticias soltas de La Voz de Galicia cando non existía aínda ningún xornal en galego), 172 revistas (entre elas números de Código Cero, Cerna, Consumer Eroski, Díxitos, Entregas de Comunicación Cultural, Feiraco, Galicia Internacional, Man Común, Petroglifo, Teatro do Noroeste, Teima, Tempos Novos e Revista Galega de Economía), 549 libros (178 novelas, 160 ensaios, 125 coleccións de relato e 87 obras de teatro), 7 guións televisivos, 157 entradas de blogs e 25 transcricións sonoras. A amplitude de documentos dos que consta o CORGA así como os criterios empregados na súa selección permítennos considerar este corpus representativo do uso lingüístico do galego actual.

No que se refire ao tamaño, a presente versión do CORGA, a 3.0, consta de 36.746.902 palabras, incluídas as cifras (44.125.386 elementos gramaticais). Hai, non obstante, un subconxunto de 582.030 formas gráficas sobre as que non se poden facer buscas, pois son unidades que aparecen en fragmentos textuais que están nunha lingua distinta do galego ou aparecen en notas de tipo bibliográfico, resultando un total de 36.164.872 formas ortográficas sobre as que si se poden realizar consultas, das cales 572.789 son formas diferentes.

As seguintes táboas amosan a distribución de frecuencias do corpus segundo os diversos parámetros de clasificación dos documentos, primeiramente por palabras e deseguido por elementos gramaticais.

Palabras ortográficas
Frecuencias
Frecuencia Palabras ortográficas Porcentaxe Porcentaxe acumulada Frecuencia das palabras Porcentaxe Porcentaxe acumulada
> 5000 636 0,11 % 0,11 % 26.722.627 63,86 % 63,86 %
1000<F<=5000 2.858 0,5 % 0,61 % 5.853.755 13,99 % 77,85 %
500<F<=1000 3.075 0,54 % 1,15 % 2.146.234 5,13 % 82,98 %
100<F<=500 16.533 2,89 % 4,03 % 3.586.014 8,57 % 91,55 %
25<F<=100 35.813 6,25 % 10,29 % 1.791.660 4,28 % 95,83 %
10<F<=25 41.504 7,25 % 17,53 % 679.991 1,62 % 97,45 %
4<F<=10 62.314 10,88 % 28,41 % 428.901 1,02 % 98,48 %
2<F<=4 63.266 11,05 % 39,46 % 214.332 0,51 % 98,99 %
F=2 75.445 13,17 % 52,63 % 150.890 0,36 % 99,35 %
F=1 271.346 47,37 % 100,0 % 271.346 0,65 % 100,0 %
Lustro
Palabras ortográficas Documentos Frec. norm.
1975-1979 811.332 117 22.434/millón
1980-1984 1.345.378 143 37.201/millón
1985-1989 1.645.299 120 45.494/millón
1990-1994 4.369.606 380 120.825/millón
1995-1999 8.002.681 12.408 221.283/millón
2000-2004 6.054.215 9.479 167.406/millón
2005-2009 7.931.265 13.877 219.309/millón
2010-2014 5.916.297 11.507 163.592/millón
2015-2019 88.799 171 2.455/millón
Área temática
Palabras ortográficas Documentos Frec. norm.
Economía e política 11.555.479 25.476 319.522/millón
Cultura e artes 3.633.154 7.700 100.461/millón
Ciencias sociais 9.044.713 10.512 250.097/millón
Ciencias e tecnoloxía 4.345.946 6.706 120.170/millón
Outros 6.364.794 19.518 175.994/millón
Medio
Palabras ortográficas Documentos Frec. norm.
Xornal 11.913.642 40.603 329.426/millón
Revista 3.491.646 4.714 96.548/millón
Libro 20.453.947 2.693 565.575/millón
Internet 65.824 160 1.820/millón
Audiovisual 239.813 32 6.631/millón
Orixe
Palabras ortográficas Documentos Frec. norm.
Oral 168.009 25 4.646/millón
Escrita 35.996.863 48.177 995.354/millón
Bloque
Palabras ortográficas Documentos Frec. norm.
Ficción 13.043.281 2.045 360.662/millón
Non ficción 22.953.582 46.132 634.693/millón
Xénero
Palabras ortográficas Documentos Frec. norm.
Narrativo 11.690.708 1.872 323.261/millón
Dramático 1.352.573 173 37.400/millón
Ensaístico 7.687.668 685 212.573/millón
Xornalístico 15.265.914 45.447 422.120/millón
Subtipo
Palabras ortográficas Documentos Frec. norm.
Novela 8.983.345 192 248.400/millón
Relato curto 2.707.363 1.680 74.862/millón
Obra de teatro 1.274.492 165 35.241/millón
Guión 78.081 8 2.159/millón
Libro de texto 511.182 7 14.135/millón
Memoria 474.937 10 13.133/millón
Artigo científico 321.136 52 8.880/millón
Divulgación 6.380.413 616 176.426/millón
Xornal 11.913.642 40.603 329.426/millón
Revista 3.286.448 4.684 90.874/millón
Blog 65.824 160 1.820/millón
Tertulia 69.041 9 1.909/millón
Informativo 42.036 8 1.162/millón
Variedades 33.229 4 919/millón
Programa cultural 23.703 4 655/millón
Elementos gramaticais
Frecuencias
Frecuencia Elementos gramaticais Porcentaxe Porcentaxe acumulada Frecuencia dos elementos Porcentaxe Porcentaxe acumulada
> 5000 588 0,1 % 0,1 % 30.587.469 68,49 % 68,49 %
1000<F<=5000 2.718 0,48 % 0,58 % 5.538.525 12,4 % 80,89 %
500<F<=1000 2.910 0,51 % 1,1 % 2.037.621 4,56 % 85,46 %
100<F<=500 15.156 2,67 % 3,77 % 3.313.813 7,42 % 92,88 %
25<F<=100 31.492 5,55 % 9,31 % 1.581.819 3,54 % 96,42 %
10<F<=25 35.806 6,31 % 15,62 % 585.037 1,31 % 97,73 %
4<F<=10 55.125 9,71 % 25,33 % 379.060 0,85 % 98,58 %
2<F<=4 58.199 10,25 % 35,59 % 197.006 0,44 % 99,02 %
F=2 73.060 12,87 % 48,46 % 146.120 0,33 % 99,34 %
F=1 292.576 51,54 % 100,0 % 292.576 0,66 % 100,0 %
Lustro
Elementos gramaticais Documentos Frec. norm.
1975-1979 963.747 117 21.841/millón
1980-1984 1.675.191 143 37.964/millón
1985-1989 2.022.319 120 45.831/millón
1990-1994 5.398.068 380 122.335/millón
1995-1999 9.825.391 12.408 222.670/millón
2000-2004 7.384.795 9.479 167.359/millón
2005-2009 9.563.278 13.877 216.730/millón
2010-2014 7.185.435 11.507 162.841/millón
2015-2019 107.162 171 2.429/millón
Área temática
Elementos gramaticais Documentos Frec. norm.
Economía e política 13.754.016 25.476 311.703/millón
Cultura e artes 4.302.675 7.700 97.510/millón
Ciencias sociais 10.712.838 10.512 242.782/millón
Ciencias e tecnoloxía 5.213.939 6.706 118.162/millón
Outros 7.608.667 19.518 172.433/millón
Medio
Elementos gramaticais Documentos Frec. norm.
Xornal 14.245.644 40.603 322.845/millón
Revista 4.191.194 4.714 94.984/millón
Libro 25.336.954 2.693 574.204/millón
Internet 80.384 160 1.822/millón
Audiovisual 271.210 32 6.146/millón
Orixe
Elementos gramaticais Documentos Frec. norm.
Oral 170.686 25 3.868/millón
Escrita 43.954.700 48.177 996.132/millón
Bloque
Elementos gramaticais Documentos Frec. norm.
Ficción 16.586.878 2.045 375.903/millón
Non ficción 27.367.822 46.132 620.229/millón
Xénero
Elementos gramaticais Documentos Frec. norm.
Narrativo 14.779.063 1.872 334.933/millón
Dramático 1.807.815 173 40.970/millón
Ensaístico 9.100.131 685 206.233/millón
Xornalístico 18.267.691 45.447 413.995/millón
Subtipo
Elementos gramaticais Documentos Frec. norm.
Novela 11.378.720 192 257.872/millón
Relato curto 3.400.343 1.680 77.061/millón
Obra de teatro 1.698.950 165 38.503/millón
Guión 108.865 8 2.467/millón
Libro de texto 635.779 7 14.408/millón
Memoria 576.533 10 13.066/millón
Artigo científico 378.138 52 8.570/millón
Divulgación 7.509.681 616 170.190/millón
Xornal 14.245.644 40.603 322.845/millón
Revista 3.941.663 4.684 89.329/millón
Blog 80.384 160 1.822/millón
Tertulia 69.360 9 1.572/millón
Informativo 43.278 8 981/millón
Variedades 33.521 4 760/millón
Programa cultural 24.527 4 556/millón
Esta web utiliza cookies propias e de terceiros co único propósito de analizar o uso da propia web. Se continúa navegando consideramos que acepta a súa utlización.