pearltrees pour des thésaurus des domaines sanitaire et médical
Sept perles pour des langages documentaires bien connus dans les chaumières des managers de l'information - enfilées par la BU Médecine dans son grand collier.
Plein de petits thésaurus
Travaux d'étudiants réalisés avec les logiciels TheW32 ou Tematres, ces thésaurus ne prétendent pas respecter toutes les règles de l'art thésaural ni bénéficier d'une expertise sectorielle assurée (pas de validation). Au moins montrent-ils quelques travers trop courants dans la production thésaurale (descripteur au pluriel, adjectif ou verbe comme descripteur, poly-hiérarchie abusive et contreproductive, inversion du sens hiérachique, etc.). C'est pourquoi, sans exception notoire, ils ne sont pas mentionnés dans le thésauro-annuaire. Ils constituent cependant une première œuvre professionnelle intellectuellement et techniquement exigeante.
Par ordre alphabétique des noms d'étudiant(e)s :
- petit thésaurus de l'environnement équin par Charlotte Acciari (2012)
- petit thésaurus de la botanique par Chloé Caquineau (2012)
- petit thésaurus de l'imprimerie par Florimond Debruyne (2012)
- thésaurus du Magic (jeu de cartes US) par Sylvain Gaydon (2012)
- petit thésaurus de la peinture par Camille Follet (2012)
- petit thésaurus de l'œnologie par Anne Grzesiak (2012)
- petit thésaurus du surréalisme par Lucie Jacquemin (2012)
- petit thésaurus de l'Europe sous la domination nazie par Louise Joignaux (2012)
- petit thésaurus de la dentelle par Aurélie Moudart (2012)
- petit thésaurus de Napoléon Ier par Brunehilde Steelandt (2012)
- petit thésaurus des énergies renouvelables par Isabelle Thierens (2012)
- le reste viendra bien...
retour à la page Élaboration de thésaurus
Des perles pour les thésaurus
Répéter tous les matins avant le petit déjeuner 20 fois en accélérant :
michelinechtimichelinechti...
Après quoi on réfléchit pour comprendre pourquoi le Thésauro-annuaire n'est pas perlé ;-)
AJOUT DU 16 MARS : le thésauro-annuaire y est !
Merci Michelinechti !
Thésauro-annuaire
Le thésauro-annuaire, répertoire des thésaurus (ou thesauri) francophones gratuits en ligne, vient d'être modifié.
Les trois fiches ont été réduites à une seule, mais trois icônes permettent de savoir s'il s'agit d'un
thésaurus
manipulable en ligne [
],
d'un thésaurus adossé à une base bibliographique [
]
ou d'un thésaurus
téléchargeable [
]. Il arrive qu'un même outil linguistique soit doté de deux icones... Ce sera plus simple à mettre à jour, mais aussi plus simple à consulter - du moins je l'espère.
Bien sûr, un outil de cette sorte court, par nature, le risque de la caducité. Les adresses réticulaires n'ayant pas de nécessaire stabilité, les liens de l'annuaire peuvent très bien donner dans le vide un jour ou l'autre. Mais je compte sur mes lecteurs et collègues pour m'avertir dans ce cas, pendant que j'exerce une veille de mon côté...
Du coup, l'arbre a disparu. Par contre, je maintiens la page de liens conduisant à divers documents sur les thésaurus (ou thesauri).
On accède au thésauro-annuaire soit par Tard-Bourrichon (thésauro-annuaire dans le pavé information-documentation à gauche) soit directement.
SKOS et ISO DIS 25964 (thésaurus)
Sylvie Dalbin nous informe de l'évolution des travaux sur la normalisation des thésaurus. C'est sur son blog Descripteurs.
On y apprend notamment que le DIS (Draft int. standard) sur les thésaurus a été présenté le 15 août dernier. L’identifiant et le titre de la (future) norme sont ISO DIS 25964-1 - Information and documentation - Thesauri and interoperability with other vocabularies - Part 1: Thesauri for information retrieval. Ce qui, dans la langue de Paul Otlet, donne Information et documentation - Thésaurus et interopérabilité avec d'autres vocabulaires - Partie 1: Thésaurus pour la recherche documentaire.
À suivre (et merci à Sylvie de nous permettre de suivre) ...
Adieu "Thésaurus ou Thesauri" ! Vive le "Thésauro-annuaire" !
Mes étudiants de la formation initiale et mes stagiaires de la formation continue connaissent l'outil que j'ai confectionné à leur intention. Dans le cadre de la formation à la pratique d'indexation avec thésaurus, il est indispensable de s'y coller et d'indexer des documents présentant telle ou telle particularité ayant un impact sur leur indexation, voire d'indexer à la volée juste pour s'entraîner. Depuis une quinzaine d'années, on voit apparaître des thésaurus sur le web, soit tout seuls (et, dans ce cas, ils peuvent être directement manipulables en ligne ou bien il faut télécharger le(s) fichier(s) en .doc, .rtf, ou .pdf, voire en .xml) soit adossés à une base de données. Bref, plutôt que de m'imposer le transport d'un nombre important de thésaurus dans leur édition papier, j'avais pensé qu'il était plus commode - pour mes petits bras - de se connecter...
Cet annuaire de thésaurus
francophones et gratuits a d'abord
été hébergé chez Mylinea
- que je remercie
sincèrement. Mais l'irruption de la pub
envahissante
(les fameuses "annonces Google" et l'inévitable popup, que semble imposer le modèle économique de
la toile marchande), les réglages des
pare-feux scolaires (dictés par le principe de
protection que l'Institution doit aux "jeunes gens", comme on disait
dans le temps) et quelques bugs m'ont incité
à rapatrier cet outil pédagogique et
technique sur ce bon vieux Tard-Bourrichon - qui n'existait pas lorsque j'ai construit l'annuaire dans sa première version.
Bref, vous allez sur Tard-Bourrichon.
Quand vous arrivez sur la page d'accueil, vous trouvez le pavé d'orientation.
Quand vous passez sur la case INFORMATION DOCUMENTATION, elle se déplie et vous propose (en fin de liste) l'accès au Thésauro-annuaire. Comme ça :
Arrivé dans à la page d'accueil du Thésauro-annuaire, vous trouverez, à ce jour, de quoi visualiser 49 thésaurus manipulables en ligne, 30 thésaurus adossés à des bases de données bibliographiques et 30 thésaurus téléchargeables - ce qui ne signifie pas que le Thésauro-annuaire pointe 109 thésaurus (ou thesauri), puisque certains sont et manipulables en ligne et téléchargeables, par exemple. Ces chiffres étant bien évidemment fatalement provisoires dans la mesure où la mise à jour du Thésauro-annuaire est continue...
Pour compléter l'ensemble, un petit moteur de recherche sur le Thésauro-annuaire est proposé...
Bien sûr, je ne revendique pas l'exhaustivité, l'impossible exhaustivité ! Mais si vous trouvez un thésaurus francophone gratuit sur le web, je vous serai reconnaissant de me le signaler par un petit message à cette adresse-là.
Merci d'avance et bonne indexation !
3. Élaboration de thésaurus
ATTENTION : à partir de janvier 2013, la séquence pédagogique est sous Passeport, plate-forme du CUEEP.
-
Après un rapide retour sur les langages documentaires en général et les thésaurus en particulier (article de Danièle Degez, par exemple), un petit jeu de "mise en thésaurus" à partir de ce lexique-ci ou de ce lexique-là. On profitera de cet exercice pour prendre en main TheW32 et TemaTres (cf. plus bas).
-
Un petit travail sur un ouvrage traitant de la construction de thésaurus s'avèrera très très utile...
... -
Les règles d'élaboration des thésaurus [Regles.zip].
Et un extrait de la norme Z 47-100.
On pourra compléter avec un court document qui oppose terminologie conceptuelle et terminologie textuelle.
-
Les étapes de l'élaboration d'un thésaurus font l'objet d'un mini-guide [Etapes.zip].
-
En complément du petit lexique des langages documentaires (219 termes) présenté à la page 2. Pratique de l'indexation, une reprise pédagogique du document sur lequel s'appuyait ledit lexique [Lexique.zip]. Mise en thésaurus de l'ouvrage de D.Dégez & D.Menillet (présentation alphabétique, présentation arborescente, liste permutée et module de recherche pour lequel l'interrogation ne porte que sur les descripteurs et les non-descripteurs, pas sur les équivalents anglais ni sur le contenu des notes).
-
Quand on s'intéresse de près à l'élaboration de langages documentaires, on ne saurait passer sous silence la personnalité de Shiyali Ramamrita Ranganathan - dont Marie-France Blanquet nous propose une biographie.
... -
Dans le cadre du travail sur un corpus à partir duquel un thésaurus devra être élaboré, on peut être amené à utiliser quelques outils logiciels, présentés ailleurs...
Deux logiciels gratuits pour confectionner un thésaurus (mettre les termes déjà choisis en relations, etc.). TheW32 - qui se trouve là (install) ou ici (zip à déballer pour appli prêt à l'emploi) - permet d'éditer le thésaurus en html ou en rtf dans sa présentation alphabétique et en forme d'arborescence. Application quelque peu rustique mais efficace. TemaTres nécessite quant à lui une installation php mysql, mais peut fonctionner sur une clé usb ;-) si on y décompresse ce dossier zip [attention, presque 50 méga-octets pour le zip ; et quatre fois plus déployé sur la clé !]. À partir du thésaurus confectionné sous TemaTres, on peut exporter un fichier SKOS (rdf) que Mondeca - quand son SkosReader est accessible en ligne - nous permettra d'éditer en html sous les trois formes classiques de présentation d'un thésaurus...
Les petits thésaurus réalisés par les étudiant(e)s sont sur une autre page.
-
En 2008, nous avons travaillé (comme en 2007) sur un corpus qui est là. L'idée est de commencer le travail d'élaboration d'un thésaurus autour des problématiques de Bertrand Schwartz. Ce corpus, en effet, a fini par être publié dans un dossier paru dans la revue Pour (n°189 de mars 2006, p.55-201). Bien sûr ce n'est pas tout à fait le même texte, mais rien n'est modifié thématiquement. Les quelques pages préliminaires de ce dossier donnent bien les informations importantes, contextualisant tout à la fois le personnage (beau texte de Louise L. Lambrichs, limite hagiographique!) et le projet éditorial, tout en balisant déjà le paysage thématique... -
Un atelier héberge les travaux d'étudiants les plus intéressants. Ceux-ci sont présentés dans le thésauro-annuaire.
mise à jour : 20 avril 2012
retour à l'index
3 (complément) . Élaboration de thésaurus
Quelques logiciels gratuits pour traitement de données textuelles
Dans le cadre du travail sur un corpus à partir duquel un thésaurus devra être élaboré, on peut être amené à utiliser quelques outils logiciels :
TextStat permet d'élaborer des statistiques textuelles à partir d'un texte (format txt). Il est en téléchargement ici ou sur la page de l'auteur du logiciel (Lionel Allorge), logiciel sous licence GNU GPL et présenté dans le fichier d'aide attaché au logiciel installé mais aussi ici
IndexG pourra rendre le même type de service que TextStat (mais avec des textes en format rtf). Il faut aller le cherche sur le site de l'auteur (Jean-Paul Blin) - qui donne le mode d'emploi.
ConcApp permet d'effectuer des recherches sur des "collocations" à l'intérieur d'un texte (format txt). Il est là, prêt à l'emploi (après décompression). L'auteur est Chris Greaves.
Occurences pourra rendre un certain nombre de services du même ordre que ConcApp (mais textes formatés en rtf), services que détaille l'auteur, Jean-Paul Blin encore, sur sa page, où on peut bien sûr télécharger...
Découvert plus récemment, le logiciel concocté par un professeur d'histoire-géographie, Georges Macé (beau nom pour un enseignant du service public!), ClairText qui fait plein de choses fort intéressantes pour qui veut analyser un corpus, notamment. Le fichier d'installation - que Georges, un jour d'avril 2007, m'a discrètement confié (d'où le mot de passe pour dézipper) - est là. Le fichier d'aide, ici (pdf non hypertextuel du fichier hlp). Pour travailler avec ClairText dans le cadre de l'exemple Bertrand Schwartz, je propose qu'on utilise ce .txt reprenant l'ensemble du livre de 2005.
L'excellent Wilbur pourra, lui aussi, rendre d'excellents services, par exemple en indexant un corpus dont les éléments textuels sont présentés sous des formats divers (txt, doc, rft, pdf, etc.). Rendez-vous sur la page de l'auteur (Craig Morris) pour le charger. La présentation et l'aide sont sur une page secondaire. Au passage, disons que Wilbur est un véritable moteur de recherche local d'une souplesse et d'une efficacité redoutable...
mise à jour : 20 janvier 2010
retour à l'index
Un site annuaire sur les thésaurus

Ma récente mise à jour des pages que je consacre aux thésaurus - pages hébergées par Mylinea - m'incitent à rédiger ce petit mot de présentation. En effet, les listes de thésaurus en ligne proposées sur la toile sont de plus en plus en plus nombreuses - la dernière en date paraissant être celle de Sylvie Dalbin, que je ne connais pas personnellement mais que je salue pour l'intérêt de son blog.
La liste que je propose (le lien figure en troisième position de ma liste de liens dans la colonne de droite du présent blog) est destinée au travail des apprenants documentalistes, qu'ils soient étudiants ou stagiaires de la formation professionnelle.
Elle ne prétend donc pas être exhaustive, dans la mesure où les critères qui président à la décision de signaler ou non tel ou tel thésaurus sont assez précis. Il s'agit d'une liste de :
thésaurus (ce qui exclut les simples lexiques, ou les thésaurus hiérarchiquement trop pauvres),en langue française (ou multilingues avec version française),praticables en ligne en tant que thésaurus isolé (avec liens internes au thésaurus afin de pouvoir y circuler) ou en tant qu'outil linguistique de recherche dans une base de données, voire simplement téléchargeables. Ce qui donne une répartition sur trois listes.
Enfin, tout un chacun peut proposer une url de thésaurus, en cliquant sur ce lien - dans le respect, bien sûr, des critères énoncés plus haut.
Par ailleurs, trois autres rubriques sont disponibles sur ce site-annuaires, outre la liste des liens vers des thésaurus de langue française et praticables en ligne :
Documents divers sur les thésaurus (ou thesauri), page qui propose de la littérature au sujet des thésaurus... là aussi le visiteur peut déposer une idée de lien... en cliquant là.Quelques Bases de Données en ligne, page écrite un jour où je devais faire travailler des apprenants sur la manipulation de bases de données - écriture sans suite (peut-être faudrait-il que je supprime cette page...) ; à moins que vous ne vouliez qu'on augmente cette liste... Dans ce cas, n'hésitez pas à proposer des liens en cliquant ici.Quelques pages en plus ?, hors thématiques thésaurus ou bases de données : ça va du vocabulaire de la documentation à la musique vocale, en passant par les langages classificatoires... C'était bien avant que Canalblog ne m'héberge !


