Canalblog
Suivre ce blog Administration + Créer mon blog
BRICH59
Publicité
thesaurus
8 mars 2009

Environnement : un nouveau thésaurus

Un de mes amis en formation vient de m'informer qu'un nouveau thésaurus dédié à l'environnement vient de voir le jour. Il se nomme THES'ENVIR.

thesenvir_2_1_Page_1Fruit d'un travail collaboratif, cet outil terminologique propose 10085 descripteurs, (plus 1085 non-descripteurs et 405 notes d'application) répartis sur 18 champs sémantiques et 4 index... Monolingue et mono-hiérarchique (jusqu’à 8 niveaux de spécificité,) THES'ENVIR est, bien sûr, conforme aux normes ISO 2788 et 5964, Sa version numérique est au format XML (985 ko). Sa version papier propose une  section alphabétique (407 pages) et une section thématique/hiérarchique (218 pages). Une liste permutée devrait voir le jour d'ici l'été. Enfin l'équipe des documentalistes auteurs de l'outil,  membres du réseau de centres de ressources à l'éducation à l'environnement en Languedoc-Roussillon, le LIEN (Lieux d'Information sur la Nature et l'Environnement), promet une mise à jour collaborative et néanmoins régulière, grâce au travail d'un club d'utilisateurs.
Tout l'info est .

Le format xml permettrait une mise en ligne simple et ô combien utile à la communauté dispersée des documentalistes œuvrant dans le secteur de l'environnement... Dommage que ce thésaurus ne soit pas en ligne ! Il ne pourra être signalé dans le thésauro-annuaire ! Il ne pourra être l'un des fruits de  l'Arbre européen des thésaurus francophones (gratuits) en ligne ! Il y aurait côtoyé le GEMET, General Multilingual Environmental Thesaurus, mis au point par ETC-CDS ( European Topic Centre on Catalogue of Data Sources ) sous couvert de l'Agence Européenne de l'Environnement ; ou encore Interwater, récent fruit du travail de l'IRC, Centre International de l'Eau et l'Assainissement,  et de ses partenaires ; etc. Dommage ! Mais ce ne sont que MES'ENVIES ;-)

Le réseau où a été conçu THES'ENVIR est le GRAINE LR, Groupe Régional d'Animation et d'Initiation à la Nature et l'Environnement, association loi 1901, adhérente au réseau national École et Nature, a pour objet la promotion et le développement de l'éducation à l'environnement vers le développement durable en Languedoc-Roussillon.
Ce réseau fonctionne en authentique collectif documentaire, notamment avec sa base de données de périodiques et revues d'éducation à l'environnement en région...

bandeau_haut


Publicité
8 septembre 2008

Adieu "Thésaurus ou Thesauri" ! Vive le "Thésauro-annuaire" !

Mes étudiants de la formation initiale et mes stagiaires de la formation continue connaissent l'outil que j'ai confectionné à leur intention. Dans le cadre de la formation à la pratique d'indexation avec thésaurus, il est indispensable de s'y coller et d'indexer des documents présentant telle ou telle particularité ayant un impact sur leur indexation, voire d'indexer à la volée juste pour s'entraîner. Depuis une quinzaine d'années, on voit apparaître des thésaurus sur le web, soit tout seuls (et, dans ce cas, ils peuvent être directement manipulables en ligne ou bien il faut télécharger le(s) fichier(s) en .doc, .rtf, ou .pdf, voire en .xml) soit adossés à une base de données. Bref, plutôt que de m'imposer le transport d'un nombre important de thésaurus dans leur édition papier, j'avais pensé qu'il était plus commode - pour mes petits bras - de se connecter...
Cet annuaire de thésaurus francophones et gratuits a d'abord été hébergé chez Mylinea - que je remercie sincèrement. Mais l'irruption de la pub envahissante 1(les fameuses "annonces Google" et l'inévitable popup, que semble imposer le modèle économique de la toile marchande), les réglages des pare-feux scolaires (dictés par le principe de protection que l'Institution doit aux "jeunes gens", comme on disait dans le temps) et quelques bugs m'ont incité à rapatrier cet outil pédagogique et technique sur ce bon vieux Tard-Bourrichon - qui n'existait pas lorsque j'ai construit l'annuaire dans sa première version.

Bref, vous allez sur Tard-Bourrichon.

Quand vous arrivez sur la page d'accueil, vous trouvez le pavé d'orientation.

Quand vous passez sur la case INFORMATION DOCUMENTATION, elle se déplie et vous propose (en fin de liste) l'accès au Thésauro-annuaire. Comme ça :

2

Arrivé dans à la page d'accueil du Thésauro-annuaire, vous trouverez, à ce jour, de quoi visualiser 49 thésaurus manipulables en ligne, 30 thésaurus adossés à des bases de données bibliographiques et 30 thésaurus téléchargeables - ce qui ne signifie pas que le Thésauro-annuaire pointe 109 thésaurus (ou thesauri), puisque certains sont et manipulables en ligne et téléchargeables, par exemple. Ces chiffres étant bien évidemment fatalement provisoires dans la mesure où la mise à jour du Thésauro-annuaire est continue...

Pour compléter l'ensemble, un petit moteur de recherche sur le Thésauro-annuaire est proposé...

Bien sûr, je ne revendique pas l'exhaustivité, l'impossible exhaustivité ! Mais si vous trouvez un thésaurus francophone gratuit sur le web, je vous serai reconnaissant de me le signaler par un petit message à cette adresse-là.

Merci d'avance et bonne indexation !


19 avril 2008

humanité du langage

Le langage machine, langage artificiel, est une création de l'homme, à coup de signes et d'algorithmes.
L'homme, quant à lui, est une création ... du langage.
Difficile question qui nous plonge dans les profondeurs de la pensée et de l'humanité.

En tous cas, aucun algorithme ne sera jamais capable de "traiter" l'ambiguïté du langage humain. Ce n'est pas moi qui le dit. C'est le "Monsieur algorithmes" de chez Google, qui dit aussi que, rien que pour l'année dernière, il y eut pas moins de 450 modifications apportées à l'algorithme de Google! Je lis ça chez le bon Olivier Ertzscheid.

Tout ceci nous permet au moins de saluer la poésie et la philosophie comme haut lieu de l'humanité.
Et l'indexation avec thésaurus comme pratique refuge de l'humain dans le monde documentaire ?


29 avril 2006

3. Élaboration de thésaurus

ATTENTION : à partir de janvier 2013, la séquence pédagogique est sous Passeport, plate-forme du CUEEP.

  • Hudon2009_4_Après un rapide retour sur les langages documentaires en général et les thésaurus en particulier (article de Danièle Degez, par exemple), un petit jeu de "mise en thésaurus" à partir de ce lexique-ci ou de ce lexique-là. On profitera de cet exercice pour prendre en main TheW32 et TemaTres (cf. plus bas).

  • Les étapes de l'élaboration d'un thésaurus font l'objet d'un mini-guide [Etapes.zip].

  • En complément du petit lexique des langages documentaires (219 termes) présenté à la page 2. Pratique de l'indexation, une reprise pédagogique du document sur lequel s'appuyait ledit lexique [Lexique.zip]. Mise en thésaurus de l'ouvrage de D.Dégez & D.Menillet (présentation alphabétique, présentation arborescente, liste permutée et module de recherche pour lequel l'interrogation ne porte que sur les descripteurs et les non-descripteurs, pas sur les équivalents anglais ni sur le contenu des notes).

  • Quand on s'intéresse de près à l'élaboration de langages documentaires, on ne saurait passer sous silence la personnalité de Shiyali Ramamrita Ranganathan - dont Marie-France Blanquet nous propose une biographie.
    ...

  • Dans le cadre du travail sur un corpus à partir duquel un thésaurus devra être élaboré, on peut être amené à utiliser quelques outils logiciels, présentés ailleurs...
    Deux logiciels gratuits pour confectionner un thésaurus (mettre les termes déjà choisis en relations, etc.). TheW32 - qui se trouve (install) ou ici (zip à déballer pour appli prêt à l'emploi) - permet d'éditer le thésaurus en html ou en rtf dans sa présentation alphabétique et en forme d'arborescence. Application quelque peu rustique mais efficace. TemaTres nécessite quant à lui une installation php mysql, mais peut fonctionner sur une clé usb ;-) si on y décompresse ce dossier zip [attention, presque 50 méga-octets pour le zip ; et quatre fois plus déployé sur la clé !]. À partir du thésaurus confectionné sous TemaTres, on peut exporter un fichier SKOS (rdf) que Mondeca - quand son SkosReader est accessible en ligne - nous permettra d'éditer en html sous les trois formes classiques de présentation d'un thésaurus...
    Les petits thésaurus réalisés par les étudiant(e)s sont sur une autre page.

  • Pour189__dossier_En 2008, nous avons travaillé (comme en 2007) sur un corpus qui est . L'idée est de commencer le travail d'élaboration d'un thésaurus autour des problématiques de Bertrand Schwartz. Ce corpus, en effet, a fini par être publié dans un dossier paru dans la revue Pour (n°189 de mars 2006, p.55-201). Bien sûr ce n'est pas tout à fait le même texte, mais rien n'est modifié thématiquement. Les quelques pages préliminaires de ce dossier donnent bien les informations importantes, contextualisant tout à la fois le personnage (beau texte de Louise L. Lambrichs, limite hagiographique!) et le projet éditorial, tout en balisant déjà le paysage thématique...

  • Un atelier héberge les travaux d'étudiants les plus intéressants. Ceux-ci sont présentés dans le thésauro-annuaire.


mise à jour : 20 avril 2012
retour à l'index 


28 avril 2006

3 (complément) . Élaboration de thésaurus

Quelques logiciels gratuits pour traitement de données textuelles


Dans le cadre du travail sur un corpus à partir duquel un thésaurus devra être élaboré, on peut être amené à utiliser quelques outils logiciels :

  • TextStat permet d'élaborer des statistiques textuelles à partir d'un texte (format txt). Il est en téléchargement ici ou sur la page de l'auteur du logiciel (Lionel Allorge), logiciel sous licence GNU GPL et présenté dans le fichier d'aide attaché au logiciel installé mais aussi ici

  • IndexG pourra rendre le même type de service que TextStat (mais avec des textes en format rtf). Il faut aller le cherche sur le site de l'auteur (Jean-Paul Blin) - qui donne le mode d'emploi.

  • ConcApp permet d'effectuer des recherches sur des "collocations" à l'intérieur d'un texte (format txt). Il est , prêt à l'emploi (après décompression). L'auteur est Chris Greaves.

  • Occurences pourra rendre un certain nombre de services du même ordre que ConcApp (mais textes formatés en rtf), services que détaille l'auteur, Jean-Paul Blin encore, sur sa page, où on peut bien sûr télécharger...

  • Découvert plus récemment, le logiciel concocté par un professeur d'histoire-géographie, Georges Macé (beau nom pour un enseignant du service public!), ClairText qui fait plein de choses fort intéressantes pour qui veut analyser un corpus, notamment. Le fichier d'installation - que Georges, un jour d'avril 2007, m'a discrètement confié (d'où le mot de passe pour dézipper) - est . Le fichier d'aide, ici (pdf non hypertextuel du fichier hlp). Pour travailler avec ClairText dans le cadre de l'exemple Bertrand Schwartz, je propose qu'on utilise ce .txt reprenant l'ensemble du livre de 2005.

  • L'excellent Wilbur pourra, lui aussi, rendre d'excellents services, par exemple en indexant un corpus dont les éléments textuels sont présentés sous des formats divers (txt, doc, rft, pdf, etc.). Rendez-vous sur la page de l'auteur (Craig Morris) pour le charger. La présentation et l'aide sont sur une page secondaire. Au passage, disons que Wilbur est un véritable moteur de recherche local d'une souplesse et d'une efficacité redoutable...

mise à jour : 20 janvier 2010
retour à l'index


Publicité
23 janvier 2006

Un site annuaire sur les thésaurus

mylineathesaurus
Ma récente mise à jour des pages que je consacre aux thésaurus - pages hébergées par Mylinea - m'incitent à rédiger ce petit mot de présentation. En effet, les listes de thésaurus en ligne proposées sur la toile sont de plus en plus en plus nombreuses - la dernière en date paraissant être celle de Sylvie Dalbin, que je ne connais pas personnellement mais que je salue pour l'intérêt de son blog.
th_saurus02
La liste que je propose (le lien figure en troisième position de ma liste de liens dans la colonne de droite du présent blog) est destinée au travail des apprenants documentalistes, qu'ils soient étudiants ou stagiaires de la formation professionnelle.

Elle ne prétend donc pas être exhaustive, dans la mesure où les critères qui président à la décision de signaler ou non tel ou tel thésaurus sont assez précis. Il s'agit d'une liste de :

  • thésaurus (ce qui exclut les simples lexiques, ou les thésaurus hiérarchiquement trop pauvres),

  • en langue française (ou multilingues avec version française),

  • praticables en ligne en tant que thésaurus isolé (avec liens internes au thésaurus afin de pouvoir y circuler) ou en tant qu'outil linguistique de recherche dans une base de données, voire simplement téléchargeables. Ce qui donne une répartition sur trois listes.

Enfin, tout un chacun peut proposer une url de thésaurus, en cliquant sur ce lien - dans le respect, bien sûr, des critères énoncés plus haut.


Par ailleurs, trois autres rubriques sont disponibles sur ce site-annuaires, outre la liste des liens vers des thésaurus de langue française et praticables en ligne :

  1. Documents divers sur les thésaurus (ou thesauri), page qui propose de la littérature au sujet des thésaurus... là aussi le visiteur peut déposer une idée de lien... en cliquant .

  2. Quelques Bases de Données en ligne, page écrite un jour où je devais faire travailler des apprenants sur la manipulation de bases de données - écriture sans suite (peut-être faudrait-il que je supprime cette page...) ; à moins que vous ne vouliez qu'on augmente cette liste... Dans ce cas, n'hésitez pas à proposer des liens en cliquant ici.

  3. Quelques pages en plus ?, hors thématiques thésaurus ou bases de données : ça va du vocabulaire de la documentation à la musique vocale, en passant par les langages classificatoires... C'était bien avant que Canalblog ne m'héberge !


22 février 2003

Lire sur la construction de thésaurus

Qui veut comprendre comment se construit un thésaurus n'a pas trop de littérature francophone à se mettre sous le dent ! La lecture régulière et attentive de la revue Documentaliste est donc de mise pour ce genre de problématique.

Je me souviens d'un excellent ouvrage de Michèle HUDON (Le thésaurus : Conception, élaboration, gestion. Montréal : ASTED, 1995), excellent ouvrage... qu'un lecteur m'avait piqué (!?!) et qui fut rapidement épuisé. Michèle Hudon en a heureusement concocté une seconde édition avec l'aide de Danièle Degez et de Dominique Ménillet : Guide pratique pour l'élaboration d'un thésaurus documentaire. Il est paru en 2009 aux éditions ASTED (diffusion ADBS pour la France) et fait l'objet d'une présentation sur le site de l'ASTED. C'est sur cet ouvrage que les étudiants sont appelés à travailler (cf. plus loin).

Des documents relativement récents sont disponibles sur la toile, comme :

Laureilhe1981p00_titreIl y a aussi l'ancienne monographie de Marie-Thérèse LAUREILHE (Le thesaurus : son rôle, sa structure, son élaboration.- Lyon : Presses de l'ENSB, 1977.- 48p. ; 2ème éd.: Le thésaurus : son rôle, sa structure, son élaboration. - Villeurbanne : Presse de l'ENSB, 1981.- 88 p.). On la trouve encore en bibliothèque spécialisée, mais sa lecture est gênée par une édition ronéotée de mauvaise qualité et parsemée de coquilles... Reste que l'écriture de cette monographie, dans sa seconde édition, est contemporaine d'un travail de révision de la norme française  Z47-100 et que, par conséquent, sa lecture peut apparaître comme une intéressante explication in situ, un commentaire in vivo du texte normatif...

Enfin, l'ouvrage de Jean AITCHISON & Alan GILCHRIST, Construire un thésaurus, traduction sur la base de la seconde édition d'un ouvrage dont la première édition remonte à 1972, publié par l'ADBS il y a une vingtaine d'année est intéressant en ce qu'il déroule méthodiquement l'ensemble de la problématique sous-jacente à l'élaboration d'un thésaurus. Son anglicisme est particulièrement flagrant (jeu du singulier/pluriel notamment).

On travaille maintenant sur l'ouvrage de Michèle Hudon sur la base duquel j'ai concocté quelques documents pour faire travailler mes étudiant(e)s [doc00, doc01, doc02, doc03, doc04, doc05a, doc05b, doc06, doc07, doc08, doc09 et doc10], auxquels j'ajoute une présentation du glossaire proposée par l'auteure à la fin de son ouvrage - non sans préciser que le lexique présenté ailleurs est bien plus complet...

Résultat des travaux étudiants de cette année (mise en ligne pour mutualisation interne au groupe d'étudiants, d'où mot de passe) : chapitre1 (version OO), chapitre2 (version OO), la suite arrive...

mis à jour le 16 décembre 2012

retour


Publicité
<< < 1 2 3 4
Publicité
Archives
Visiteurs
Depuis la création 262 234
Publicité