UNIVERSITÉ D'OTTAWA Faculté des Arts

Laboratoire de français ancien

Base lemmatisée des graphies de
l'ancien français (LFA/INaLF)


Le Laboratoire de français ancien (LFA) de l'Université d'Ottawa procède à l'établissement d'une base des formes graphiques occurrentes de l'ancien français (AF) regroupées par vedettes (lemmes). Il s'agit de commencer pour l'AF ce qui a été effectué pour l'italien avec les Spogli elettronici dell'Italiano des origines au début du Trecento et de tracer une voie d'avenir pour la recherche sur le lexique, la graphématique et la morphologie du français des premiers textes jusqu'à la fin du XIIIe siècle.

Cette base se fonde d'abord sur la saisie progressive des graphies du Dictionnaire de l'ancienne langue française de F.Godefroy (1881-1902), entreprise à la suggestion de G.Roques (INaLF, Nancy). Elle est enrichie graduellement par la greffe partielle (formes et lemmes) du répertoire des graphies verbales de l'AF réalisé jadis pour l'INaLF (sous la direction de P.Imbs), par R.Martin; ce dernier a, en effet, mis son travail à la disposition du LFA.

Par convention, les lemmes retenus pour coiffer les occurrences seront ceux du TOBLER-LOMMATZSCH. Seront exclus d'emblée les mots grammaticaux (à l'exception des cas, rares, de changement de catégorie).

La constitution de ce «dictionnaire» des formes et lemmes (avec référence aux textes, mais sans définition) permettra, par phases successives, une lemmatisation semi-automatique des oeuvres d'AF. On s'inspirera, à cet égard, du modèle suivi par l'équipe de S.Monsonégo (Unité de Recherche sur le Français Ancien, Université de Nancy II) et présenté dans La Lemmatisation assistée par ordinateur de textes de moyen français (Cahiers du CRAL, 1989).

La lemmatisation s'effectuera d'abord sur des textes du XIIe siècle. La première tranche comportera les textes suivants, offrant un éventail de genres littéraires:

Lais et romans:

  • Lais de Marie de France
  • Roman d'Alexandre
  • Roman de Thèbes.
  • Énéas
  • Éracle
  • Ipomédon
  • Roman de Tristan de Béroul
  • Roman de Tristan de Thomas d'Angleterre

Chansons de geste:

  • Chanson de Roland
  • Couronnement de Louis
  • Ami et Amile
  • Prise d'Orange

Récits hagiographiques:

  • Vie de saint Alexis
  • Voyage de saint Brendan
  • Le Gracial d'Adgar

Fabliaux:

  • Richeut
  • Trubert

Théâtre:

  • Jeu d'Adam

Au fur et à mesure de la lemmatisation, on diffusera sous forme de disquettes, aux chercheurs qui en feront la demande, les index lemmatisés des oeuvres dépouillées.

La lemmatisation des textes permettra d'enrichir la base, qui restera ouverte aux apports successifs. Tout lemme paraissant dans une oeuvre sera accompagné, dans la base, d'un renvoi à l'index lemmatisé de cette oeuvre. On obtiendra ainsi, sans alourdir l'outil, une vue précise des masses lexicales et du mouvement du vocabulaire, avec la possibilité d'étudier indirectement la distribution des formes dans les textes particuliers.

La base pourrait aussi intégrer les glossaires des nouvelles éditions, lors de leur parution, en tenant compte, dans la mesure du possible, des comptes rendus qui leur sont consacrés. A cette occasion et dans ce but, on pourrait concevoir des règles simples pour l'établissement des glossaires d'oeuvres d'AF. Les éditeurs, de cette façon, profiteraient de la base et y apporteraient en retour une importante contribution.


Page d'accueil


Dernière mise à jour : 09.11.1999
Pour toute question au sujet de ce site, veuillez vous adresser à :
E-maillabo@francaisancien.net