Concordances et tables de
fréquence
Nous présentons ici quelques concordances et données distributionnelles pour
faciliter l'étude thématique et linguistique de l'œuvre de Raoul. Si le
corpus ne comporte que 4215 occurrences, les résultats sont pourtant
intéressants, surtout en les comparant avec ceux obtenus par Lavis dans son
index des chansons de Blondel de Nesle [1].
Pour créer les bases de données, nous avons balisé les onze
cansos que nous attribuons à Raoul. Est exclu le jeu-parti qui, de par
sa fonction ludique, présente un vocabulaire tout autre que
celui qui est de rigueur dans les chansons d'amour (l'inclusion des
tournures telles que
ventres gros et farsis, en tenebres tastonner et vous
resenblez le gaaignon, on le voit, fausserait les résultats). Les textes
ont ensuite été indexés par le logiciel
TACT
et soumis aux programmes
UseBase et TactStat, qui ont
généré les données et statistiques suivantes (parmi d'autres) :
- nombre d'occurrences (tokens) : 4215 ;
- nombre de mots distincts (types) : 1169 ;
- nombre d'hapax legomena (types possédant une seule
occurrence dans le corpus) : 745 (17.6% du texte). Ce dernier chiffre et
le nombre de types sont sujets à caution, étant donné le manque de
normalisation de l’orthographe. À titre
d'exemple, le mot cortoixie est compté comme hapax legomenon alors que cortoisie
se rencontre 3 fois. En fait, l'index lemmatisé compte 700 lemmes
sur 4215 occurrences. Notons que pour obtenir des résultats plus précis, il aurait
fallu encoder les textes d'après un système phonétique (cf. la méthode
utilisée dans notre étude sur les anagrammes),
travail intéressant mais considérable que nous nous proposons d’entreprendre à une date
plus tardive ;
- longueur moyenne des mots : 3.8 ;
- nombre de formes verbales : 910 (21.59%) ;
- nombre de substantifs : 728 (17.27%) ;
- nombre d'adjectifs (sont exclus les adjectifs possessifs et
démonstratifs) : 315 (7.48%) ;
- nombre de pronoms personnels : 266 (6.31%) ;
- nombre des conjonctions et, que, cant,
car, mais, ne, se : 497 (11.79%) ;
- les 10 verbes les plus fréquents : estre (85), avoir
(75), faire (62), pooir (42), amer (27), savoir
(27), dire (21), voloir (20), chanter (19) et
veoir (17) ;
- les 10 substantifs les plus fréquents : amors (53), cuer
(32), joie (32), dame (29), merci (18), dolor
(17), mort (16), cors (16), chançon (13), biauté
(13) et Dieu (13) ;
- les 10 adjectifs les plus fréquents : douz (29), tot
(25), bel (28), bon (19), grant (16), autre
(13), fin (10), las (10), plaisant (9) et sage
(7).
En dehors de l'index lemmatisé, nous présentons:
[1] Georges Lavis,
Les chansons de Blondel de Nesle.
Concordances et index établis d'après l'édition L. Wiese (Liège, Institut de
lexicologie française de l'Univ. de Liège, 1970).
|