Canalblog
Editer l'article Suivre ce blog Administration + Créer mon blog
BRICH59
Publicité
28 avril 2006

3 (complément) . Élaboration de thésaurus

Quelques logiciels gratuits pour traitement de données textuelles


Dans le cadre du travail sur un corpus à partir duquel un thésaurus devra être élaboré, on peut être amené à utiliser quelques outils logiciels :

  • TextStat permet d'élaborer des statistiques textuelles à partir d'un texte (format txt). Il est en téléchargement ici ou sur la page de l'auteur du logiciel (Lionel Allorge), logiciel sous licence GNU GPL et présenté dans le fichier d'aide attaché au logiciel installé mais aussi ici

  • IndexG pourra rendre le même type de service que TextStat (mais avec des textes en format rtf). Il faut aller le cherche sur le site de l'auteur (Jean-Paul Blin) - qui donne le mode d'emploi.

  • ConcApp permet d'effectuer des recherches sur des "collocations" à l'intérieur d'un texte (format txt). Il est , prêt à l'emploi (après décompression). L'auteur est Chris Greaves.

  • Occurences pourra rendre un certain nombre de services du même ordre que ConcApp (mais textes formatés en rtf), services que détaille l'auteur, Jean-Paul Blin encore, sur sa page, où on peut bien sûr télécharger...

  • Découvert plus récemment, le logiciel concocté par un professeur d'histoire-géographie, Georges Macé (beau nom pour un enseignant du service public!), ClairText qui fait plein de choses fort intéressantes pour qui veut analyser un corpus, notamment. Le fichier d'installation - que Georges, un jour d'avril 2007, m'a discrètement confié (d'où le mot de passe pour dézipper) - est . Le fichier d'aide, ici (pdf non hypertextuel du fichier hlp). Pour travailler avec ClairText dans le cadre de l'exemple Bertrand Schwartz, je propose qu'on utilise ce .txt reprenant l'ensemble du livre de 2005.

  • L'excellent Wilbur pourra, lui aussi, rendre d'excellents services, par exemple en indexant un corpus dont les éléments textuels sont présentés sous des formats divers (txt, doc, rft, pdf, etc.). Rendez-vous sur la page de l'auteur (Craig Morris) pour le charger. La présentation et l'aide sont sur une page secondaire. Au passage, disons que Wilbur est un véritable moteur de recherche local d'une souplesse et d'une efficacité redoutable...

mise à jour : 20 janvier 2010
retour à l'index


Publicité
Commentaires
Publicité
Archives
Visiteurs
Depuis la création 262 235
Publicité
Publicité