El corpus se compone de unos cinco millones de palabras romances, y más de millón y medio de palabras en latín y hebreo. El número de palabras y versículos se distribuyen de la siguiente manera:
Códice | Versículos | Nº de palabras |
Fazienda | 3.258 | 58.616 |
E8/E6 | 31.914 | 285.265/408.068 |
General Estoria | 26.453 | 730.282 |
E3 | 24.558 | 539.864 |
AJ | 6.998 | 156.391 |
E19 | 9.223 | 225.114 |
E7/E5 | 22.825 | 253.323/274.185 |
EV | 7.823 | 145.150 |
E4 | 27.176 | 592.171 |
BNM | 14.131 | 277.492 |
RAH | 6.747 | 167.629 |
Arragel | 22.657 | 562.595 |
Frags. s. XV | 7.583 | 135.024 |
TOTAL PALABRAS EN ROMANCE | 4.811.169 | |
Vulgata (BVS) | 36.306 | 624.119 |
Hebreo (BHS) | 23.214 | 306.790 |
Transcripción hebreo | 23.214 | 306.790 |
Lemas hebreos | 23.214 | 433.628 |
TOTAL PALABRAS EN LAS FUENTES | 1.671.327 | |
TOTAL PALABRAS EN EL CORPUS | 6.482.496 |
Además el corpus enlaza a más de 17000 imágenes digitales de los códices que lo componen.