A l’occasion du passage à une nouvelle version, modernisée et enrichie, de la base Frantext, nous vous proposons un focus sur cette base de données textuelle.

 

Tout d’abord, qu’est-ce que Frantext ?

  • le fruit du travail d’une équipe de l’ATILF-CNRS : une vingtaine de chercheurs, d’enseignants-chercheurs, d’ingénieurs et de collaborateurs scientifiques qui travaillent en lien avec des spécialistes en sciences du langage, en littérature française, des informaticiens ainsi qu’une équipe en charge de la numérisation et du balisage
  • une base de données de textes français littéraires et philosophiques, mais aussi scientifiques et techniques (environ 10%) qui vont de 950 à nos jours : 4987 références dont 1026 sont postérieurs à 1950
  • des corpus sélectionnés en fonction de leur diversité et représentativité : textes littéraires classiques, presse, ouvrages scientifiques, livres de cuisine, traités de cynégétique, manuels, romans policiers…
  • des possibilités de recherches simples et complexes sur des formes, des lemmes ou des catégories grammaticales dans un corpus donné
  • attention : cette base ne permet pas le téléchargement ni la lecture des textes en version intégrale. Les versions numériques des textes libres de droit sont téléchargeables sur le site du CNRTL.

 

 

Quelles nouveautés grâce à Frantext 2 ?

  • une interface modernisée
  • la création simplifiée d’un corpus à partir des métadonnées : corpus prédéfinis, création personnalisée de corpus
  • des corpus enrichis, lemmatisés et catégorisés
  • l’usage des expressions régulières et CQL (Corpus Query Language) dans les recherches avancées, listes de mots et grammaires avec assistant de conception des requêtes
  • de nouvelles fonctionnalités de tri, filtre et visualisation des résultats

 

La version 2 de Frantext remplacera définitivement la 1ère version à partir du 30 juin. Pour vous aider à utiliser cette nouvelle version, une documentation est disponible ici.