Concordances et tables de fréquence

Nous présentons ici quelques concordances et données distributionnelles pour faciliter l'étude thématique et linguistique de l'œuvre de Raoul. Si le corpus ne comporte que 4215 occurrences, les résultats sont pourtant intéressants, surtout en les comparant avec ceux obtenus par Lavis dans son index des chansons de Blondel de Nesle [1].

Pour créer les bases de données, nous avons balisé les onze cansos que nous attribuons à Raoul. Est exclu le jeu-parti qui, de par sa fonction ludique, présente un vocabulaire tout autre que celui qui est de rigueur dans les chansons d'amour (l'inclusion des tournures telles que ventres gros et farsis, en tenebres tastonner et vous resenblez le gaaignon, on le voit, fausserait les résultats). Les textes ont ensuite été indexés par le logiciel TACT et soumis aux programmes UseBase et TactStat, qui ont généré les données et statistiques suivantes (parmi d'autres) :

  • nombre d'occurrences (tokens) : 4215 ;
  • nombre de mots distincts (types) : 1169 ;
  • nombre d'hapax legomena (types possédant une seule occurrence dans le corpus) : 745 (17.6% du texte). Ce dernier chiffre et le nombre de types sont  sujets à caution, étant donné le manque de normalisation de l’orthographe. À titre d'exemple, le mot cortoixie est compté comme hapax legomenon alors que cortoisie se rencontre 3 fois. En fait, l'index lemmatisé compte 700 lemmes sur 4215 occurrences. Notons que pour obtenir des résultats plus précis, il aurait fallu encoder les textes d'après un système phonétique (cf. la méthode utilisée dans notre étude sur les anagrammes), travail intéressant mais considérable que nous nous proposons d’entreprendre à une date plus tardive ;
  • longueur moyenne des mots : 3.8 ;
  • nombre de formes verbales : 910 (21.59%) ;
  • nombre de substantifs : 728 (17.27%) ;
  • nombre d'adjectifs (sont exclus les adjectifs possessifs et démonstratifs) : 315 (7.48%) ;
  • nombre de pronoms personnels : 266 (6.31%) ;
  •  nombre des conjonctions et, que, cant, car, mais, ne, se : 497 (11.79%) ;
  • les 10 verbes les plus fréquents : estre (85), avoir (75), faire (62), pooir (42), amer (27), savoir (27), dire (21), voloir (20), chanter (19) et veoir (17) ;
  • les 10 substantifs les plus fréquents : amors (53), cuer (32), joie (32), dame (29), merci (18), dolor (17), mort (16), cors (16), chançon (13), biauté (13) et Dieu (13) ;
  • les 10 adjectifs les plus fréquents : douz (29), tot (25), bel (28), bon (19), grant (16), autre (13), fin (10), las (10), plaisant (9) et sage (7).

En dehors de l'index lemmatisé, nous présentons:



[1]  Georges Lavis, Les chansons de Blondel de Nesle. Concordances et index établis d'après l'édition L. Wiese (Liège, Institut de lexicologie française de l'Univ. de Liège, 1970).