3 (complément) . Élaboration de thésaurus
Quelques logiciels gratuits pour traitement de données textuelles
Dans le cadre du travail sur un corpus à partir duquel un thésaurus devra être élaboré, on peut être amené à utiliser quelques outils logiciels :
TextStat permet d'élaborer des statistiques textuelles à partir d'un texte (format txt). Il est en téléchargement ici ou sur la page de l'auteur du logiciel (Lionel Allorge), logiciel sous licence GNU GPL et présenté dans le fichier d'aide attaché au logiciel installé mais aussi ici
IndexG pourra rendre le même type de service que TextStat (mais avec des textes en format rtf). Il faut aller le cherche sur le site de l'auteur (Jean-Paul Blin) - qui donne le mode d'emploi.
ConcApp permet d'effectuer des recherches sur des "collocations" à l'intérieur d'un texte (format txt). Il est là, prêt à l'emploi (après décompression). L'auteur est Chris Greaves.
Occurences pourra rendre un certain nombre de services du même ordre que ConcApp (mais textes formatés en rtf), services que détaille l'auteur, Jean-Paul Blin encore, sur sa page, où on peut bien sûr télécharger...
Découvert plus récemment, le logiciel concocté par un professeur d'histoire-géographie, Georges Macé (beau nom pour un enseignant du service public!), ClairText qui fait plein de choses fort intéressantes pour qui veut analyser un corpus, notamment. Le fichier d'installation - que Georges, un jour d'avril 2007, m'a discrètement confié (d'où le mot de passe pour dézipper) - est là. Le fichier d'aide, ici (pdf non hypertextuel du fichier hlp). Pour travailler avec ClairText dans le cadre de l'exemple Bertrand Schwartz, je propose qu'on utilise ce .txt reprenant l'ensemble du livre de 2005.
L'excellent Wilbur pourra, lui aussi, rendre d'excellents services, par exemple en indexant un corpus dont les éléments textuels sont présentés sous des formats divers (txt, doc, rft, pdf, etc.). Rendez-vous sur la page de l'auteur (Craig Morris) pour le charger. La présentation et l'aide sont sur une page secondaire. Au passage, disons que Wilbur est un véritable moteur de recherche local d'une souplesse et d'une efficacité redoutable...
mise à jour : 20 janvier 2010
retour à l'index