Corpus de Referencia do Galego Actual

Ata o momento incorporáronse ao CORGA 641 xornais (exemplares completos d’A Nosa Terra, A Peneira, De Luns a Venres, Diario Oficial de Galicia, Galicia Hoxe, O Correo Galego, O Xornal de Galicia e Sermos Galiza e noticias soltas de La Voz de Galicia cando non existía aínda ningún xornal en galego), 293 revistas (entre elas números de Código Cero, Cerna, Consumer Eroski, Díxitos, Entregas de Comunicación Cultural, Feiraco, Galicia Internacional, Man Común, Petroglifo, Teatro do Noroeste, Teima, Tempos Novos e Revista Galega de Economía), 569 libros (189 novelas, 161 ensaios, 129 coleccións de relato e 91 obras de teatro), 7 guións televisivos, 157 entradas de blogs e 50 transcricións sonoras. A amplitude de documentos dos que consta o CORGA así como os criterios empregados na súa selección permítennos considerar este corpus representativo do uso lingüístico do galego actual.

No que se refire ao tamaño, a presente versión do CORGA, a 3.2, consta de 40.178.271 palabras, incluídas as cifras (48.184.012 elementos gramaticais). Hai, non obstante, un subconxunto de 633.864 formas gráficas sobre as que non se poden facer buscas, pois son unidades que aparecen en fragmentos textuais que están nunha lingua distinta do galego ou aparecen en notas de tipo bibliográfico, resultando un total de 39.544.407 formas ortográficas sobre as que si se poden realizar consultas, das cales 595.493 son formas diferentes.

As seguintes táboas amosan a distribución de frecuencias do corpus segundo os diversos parámetros de clasificación dos documentos, primeiramente por palabras e deseguido por elementos gramaticais.

Palabras ortográficas
Frecuencias
Frecuencia Palabras ortográficas Frecuencia normalizada Frecuencia normalizada acumulada Frecuencia das palabras Frecuencia normalizada Frecuencia normalizada acumulada
> 5000 703 0,12 % 0,12 % 29.543.041 64,62 % 64,62 %
1000<F<=5000 3.097 0,52 % 0,64 % 6.374.886 13,94 % 78,57 %
500<F<=1000 3.279 0,55 % 1,19 % 2.293.154 5,02 % 83,58 %
100<F<=500 17.502 2,94 % 4,13 % 3.800.476 8,31 % 91,89 %
25<F<=100 37.570 6,31 % 10,44 % 1.885.731 4,12 % 96,02 %
10<F<=25 43.396 7,29 % 17,72 % 710.309 1,55 % 97,57 %
4<F<=10 65.230 10,95 % 28,68 % 449.264 0,98 % 98,56 %
2<F<=4 65.729 11,04 % 39,72 % 222.744 0,49 % 99,04 %
F=2 78.563 13,19 % 52,91 % 157.126 0,34 % 99,39 %
F=1 280.425 47,09 % 100,0 % 280.425 0,61 % 100,0 %
Lustro
Palabras ortográficas Documentos Frec. norm.
1975-1979 811.519 117 20.522/millón
1980-1984 1.345.949 143 34.036/millón
1985-1989 1.646.519 120 41.637/millón
1990-1994 4.393.605 386 111.106/millón
1995-1999 8.069.491 12.423 204.061/millón
2000-2004 6.058.547 9.479 153.209/millón
2005-2009 7.936.959 13.877 200.710/millón
2010-2014 8.474.477 14.478 214.303/millón
2015-2019 807.341 1.627 20.416/millón
Área temática
Palabras ortográficas Documentos Frec. norm.
Economía e política 12.441.201 26.966 314.613/millón
Cultura e artes 4.310.099 8.980 108.994/millón
Ciencias sociais 10.313.221 12.098 260.801/millón
Ciencias e tecnoloxía 5.215.378 8.734 131.887/millón
Outros 7.510.779 21.411 189.933/millón
Sen clasificar 14.068.578 2.162 355.767/millón
Medio
Palabras ortográficas Documentos Frec. norm.
Xornal 12.181.778 41.122 308.053/millón
Revista 5.514.372 8.502 139.448/millón
Libro 21.447.180 2.809 542.357/millón
Internet 65.864 160 1.666/millón
Audiovisual 335.213 57 8.477/millón
Orixe
Palabras ortográficas Documentos Frec. norm.
Oral 263.407 50 6.661/millón
Escrita 39.281.000 52.600 993.339/millón
Bloque
Palabras ortográficas Documentos Frec. norm.
Ficción 13.891.892 2.160 351.299/millón
Non ficción 25.389.108 50.440 642.040/millón
Xénero
Palabras ortográficas Documentos Frec. norm.
Narrativo 12.501.549 1.979 316.139/millón
Dramático 1.390.343 181 35.159/millón
Ensaístico 7.832.692 686 198.073/millón
Xornalístico 17.556.416 49.754 443.967/millón
Subtipo
Palabras ortográficas Documentos Frec. norm.
Novela 9.671.594 203 244.576/millón
Relato curto 2.829.955 1.776 71.564/millón
Obra de teatro 1.312.261 173 33.184/millón
Guión 78.082 8 1.975/millón
Libro de texto 511.898 7 12.945/millón
Memoria 474.923 10 12.010/millón
Artigo científico 321.505 52 8.130/millón
Divulgación 6.524.366 617 164.988/millón
Xornal 12.181.778 41.122 308.053/millón
Revista 5.308.774 8.472 134.248/millón
Blog 65.864 160 1.666/millón
Tertulia 69.059 9 1.746/millón
Informativo 61.756 11 1.562/millón
Variedades 107.483 16 2.718/millón
Programa cultural 23.708 4 600/millón
Publicidade 1.401 10 35/millón
Elementos gramaticais
Frecuencias
Frecuencia Elementos gramaticais Frecuencia normalizada Frecuencia normalizada acumulada Frecuencia dos elementos Frecuencia normalizada Frecuencia normalizada acumulada
> 5000 649 0,11 % 0,11 % 33.698.565 69,12 % 69,12 %
1000<F<=5000 2.984 0,5 % 0,61 % 6.081.922 12,48 % 81,6 %
500<F<=1000 3.080 0,52 % 1,12 % 2.144.825 4,4 % 86,0 %
100<F<=500 15.991 2,68 % 3,8 % 3.498.539 7,18 % 93,18 %
25<F<=100 32.727 5,48 % 9,29 % 1.649.560 3,38 % 96,56 %
10<F<=25 37.358 6,26 % 15,55 % 610.602 1,25 % 97,81 %
4<F<=10 57.803 9,69 % 25,24 % 397.534 0,82 % 98,63 %
2<F<=4 61.080 10,24 % 35,47 % 206.766 0,42 % 99,05 %
F=2 77.260 12,95 % 48,42 % 154.520 0,32 % 99,37 %
F=1 307.822 51,58 % 100,0 % 307.822 0,63 % 100,0 %
Lustro
Elementos gramaticais Documentos Frec. norm.
1975-1979 964.816 117 20.024/millón
1980-1984 1.674.613 143 34.755/millón
1985-1989 2.020.451 120 41.932/millón
1990-1994 5.419.144 386 112.468/millón
1995-1999 9.889.325 12.423 205.241/millón
2000-2004 7.388.909 9.479 153.348/millón
2005-2009 9.566.361 13.877 198.538/millón
2010-2014 10.300.109 14.478 213.766/millón
2015-2019 960.284 1.627 19.930/millón
Área temática
Elementos gramaticais Documentos Frec. norm.
Economía e política 14.813.898 26.966 307.444/millón
Cultura e artes 5.113.154 8.980 106.117/millón
Ciencias sociais 12.229.792 12.098 253.814/millón
Ciencias e tecnoloxía 6.240.077 8.734 129.505/millón
Outros 8.972.767 21.411 186.219/millón
Sen clasificar 17.807.313 2.162 369.569/millón
Medio
Elementos gramaticais Documentos Frec. norm.
Xornal 14.571.997 41.122 302.424/millón
Revista 6.607.736 8.502 137.135/millón
Libro 26.556.176 2.809 551.141/millón
Internet 80.425 160 1.669/millón
Audiovisual 367.678 57 7.631/millón
Orixe
Elementos gramaticais Documentos Frec. norm.
Oral 268.322 50 5.569/millón
Escrita 47.915.690 52.600 994.431/millón
Bloque
Elementos gramaticais Documentos Frec. norm.
Ficción 17.644.668 2.160 366.193/millón
Non ficción 30.271.022 50.440 628.238/millón
Xénero
Elementos gramaticais Documentos Frec. norm.
Narrativo 15.797.159 1.979 327.851/millón
Dramático 1.847.509 181 38.343/millón
Ensaístico 9.260.949 686 192.200/millón
Xornalístico 21.010.073 49.754 436.038/millón
Subtipo
Elementos gramaticais Documentos Frec. norm.
Novela 12.243.488 203 254.099/millón
Relato curto 3.553.671 1.776 73.752/millón
Obra de teatro 1.739.867 173 36.109/millón
Guión 107.642 8 2.234/millón
Libro de texto 634.422 7 13.167/millón
Memoria 575.944 10 11.953/millón
Artigo científico 378.631 52 7.858/millón
Divulgación 7.671.952 617 159.222/millón
Xornal 14.571.997 41.122 302.424/millón
Revista 6.357.651 8.472 131.945/millón
Blog 80.425 160 1.669/millón
Tertulia 69.310 9 1.438/millón
Informativo 63.809 11 1.324/millón
Variedades 109.298 16 2.268/millón
Programa cultural 24.513 4 509/millón
Publicidade 1.392 10 29/millón
Esta web utiliza cookies propias e de terceiros co único propósito de analizar o uso da propia web. Se continúa navegando consideramos que acepta a súa utilización.