lundi 18 janvier

Bruno-Bernard Simon, Comparez et maîtrisez les moteurs de recherche. Note de lecture

 BBS2019Formateur ADBS, dans le cadre de la formation continue destinée aux professionnels de l’information et de la documentation, l’A. est spécialisé sur la recherche avancée, l’architecture de l’information et la création Web. Cet ouvrage n’est pas son premier opus sur le sujet. En 2014, les éditions Klog publiaient Vos recherches avec Google™ (ouvrage épuisé)(1). Depuis, plusieurs moteurs tentent de prendre leur part de ce marché de la recherche sur l’internet que Google domine : selon le site Webrankinfo(2), Google totalise en France plus de 90% des requêtes avec 81,60% sur les ordinateurs mais 96,58% sur les mobiles (effet Android). Ces moteurs sont, dans l’ordre des parts de marché, toujours selon la même source, l’allemand Ecosia, l’américain DuckDuckGo© et le français, dernier arrivé, Qwant®. Aucun des trois ne dépasse les 2% des parts de marché... C’est le fonctionnement de ces quatre moteurs que l’A. veut présenter en toute simplicité de langage. Leurs fonctionnements comparés mais aussi les écosystèmes où ils s’inscrivent.

D’abord l’écosystème Internet plus largement, histoire d’en retracer les évolutions importantes pour ce qu’elles ont induit d’évolution des pratiques de recherche d’information sur le réseau. Pédagogue, l’A. nous brosse cela en vingt-six pages claires bien que denses. Cette introduction de l’ouvrage constitue le fonds de culture commune à partir duquel les professionnel·le·s de l’information que sont les bibliothécaires, archivistes et autres documentalistes(3) peuvent déployer l’intelligence de leur pratique professionnelle.

 

Ensuite, l’ouvrage se divise en deux grandes parties, inégales en taille. La première est consacrée à Google (p.45-208), la seconde aux trois “petits” moteurs, outils “alternatifs” de la recherche d’information sur Internet (p.209-284). Pourquoi une telle disproportion ? Pourquoi Google mobilise-t-il plus de la moitié de l'ouvrage à lui seul, les trois “alternatifs” n’ayant droit qu’à à peine plus du quart de celui-lui ? Je vois trois raisons à cela. Tout d’abord il y a un effet historique. Google vient de fêter ses vingt-deux ans en septembre dernier et ce n’est pas trop de dire qu’il a déterminé pour une grande part les évolutions du fonctionnement de l’Internet et que, du coup, la compréhension des pratiques de recherche d’information passe immanquablement par la compréhension de l’outil californien. La seconde raison tient dans le constat tout simple du poids de cet outil dans les usages, notamment en France. Enfin, l'ouvrage que l’A. a publié en 2014 est épuisé. Aussi fallait-il introduire à nouveau à la fois les excellentes explications que l’A. nous offrait du fonctionnement de Google et les conseils qu’il prodiguait pour “maîtriser Google”. De ce point de vue, la grande première partie de l'ouvrage de 2019 doit être considérée comme une nouvelle édition avec mise à jour de l'ouvrage de 2014(4). Concernant cette partie, je me permets donc de renvoyer le lecteur à la note de lecture publiée à l’automne 2014 dans Documentaliste-Sciences de l'Information 2014/3 (vol.51), aujourd’hui consultable gratuitement sur Cairn(5).

Quelques modifications significatives cependant. Tout d’abord, on notera que, à côté de l’augmentation exponentielle du volume de données sur le web, la quantité de recherches à la minute sur Google a presque doublé en quatre ans (2014-2018), passant de 2 à 3,7 millions (p.38 sq.). Début 2021, on approcherait les 4 millions… Ensuite, nous avons tous vu arriver, en 2015, le RankBrain, algorithme d’intelligence artificielle et d’apprentissage automatique. Il s’agit d’un magnifique outil capable d’étendre la requête de l’utilisateur, en fonction d’une certaine proximité lexicale. Le problème est que, devant une requête simple mais utilisant des termes polysémiques, Google sera peut-être “un peu dépassé”, malgré des efforts de contextualisation (p.60 sqq.)(6). Du coup, on peut s’interroger sur les limites de l’intelligence artificielle (p.96 sqq.), mais aussi sur celles de Google sous différents aspects (p.89 sqq.). Enfin, on peut remarquer que Google a abandonné plusieurs éléments de sa syntaxe. Ainsi, les signes + (forçage de la recherche sur un terme), ~ (encore la question de la gestion de la synonymie !), les syntaxes cache:, info: ou related:, les recherches sur les prix…

 

L’économiste Ernst Friedrich Schumacher(7), cité par notre A. dans les dernières pages, affirmait, quelques décennies avant la naissance de Google, que “l'économie du gigantisme et de l'automation est un résidu des conditions et de la pensée du 19ème siècle. Elle est tout à fait incapable de résoudre le moindre problème réel de notre temps. On aurait besoin d'un système de pensée entièrement nouveau, système qui repose sur la prise en considération des personnes avant la prise en considération des biens (que les biens s'occupent d'eux-mêmes !)”. Par un curieux retournement, Google semble avoir porté cette vision jusque dans ses conséquences les plus fouillées, en faisant reposer son excellence sur la prise en compte des personnes que nous sommes tou·te·s. “La puissance de Google est dans sa connaissance de ses utilisateurs”, confirme notre A. (p.253), qui précise que “toutes les inventions de Google ne cherchent qu’à déduire toujours mieux nos pensées par nos actes conscients ou non. Nous ne pouvons pas refuser cette extraction automatisée, permanente et occulte” (p.197 sq.). De là à envisager une "dégooglisation" sévère(8)... C’est le sujet traité dans le chapitre “Transition” qui clôt la première partie de notre ouvrage (p.193-208).

Mais quels sont les autres outils, capables d’autant d’efficacité à la recherche que Google (quand on le maîtrise !) mais moins abusivement “surveillant” que lui ? La seconde partie de notre ouvrage propose ainsi trois de ces outils, trois moteurs alternatifs, à savoir Ecosia, DuckDuckGo et Qwant. Ils ne sont pas les seuls moteurs alternatifs. Au moins sont-ils “parfaitement représentatifs aujourd’hui de la concurrence à Google” (p.211). Pour chacun d’eux, l’A. commence par exhiber ce que ses promoteurs mettent en avant : pour Ecosia sa vocation écologique et sociale, pour DuckDuckGo sa détermination de non traçage et pour Qwant sa francité. On notera que, même s’ils ne mettent pas ce point avant toute chose, Ecosia et Qwant pratiquent eux aussi le non traçage. Car la force principale de l’alternative est là : proposer un modèle qui ne repose pas sur l’extraction automatisée que pratique la pieuvre de Mountain View.

Pour chacun des moteurs, l’A. passe en revue, voire en détail, son écosystème et sa stratégie, son fonctionnement et ses limites : syntaxe pour la recherche simple et la recherche avancée, analyse des réponses comparées à celles de Google, particularités - non sans insister sur ce qui le caractérise. Pour chaque moteur, une vingtaine de pages claires et “documentées”.

 

On peut se souvenir de la présence d’un chapitre explicitement pédagogique dans l'ouvrage de 2014 (“Former ses utilisateurs à Google”). L’ouvrage de 2019 en fait l’économie. C’est qu’il est déjà dans son ensemble un formidable support pour tout formateur qui voudrait initier ses apprenant·e·s à Google, voire parfaire leurs pratiques de recherche d’information en général. Bien sûr, il constitue un tout aussi excellent outil d’autoformation pour les non-professionnel·le·s.

Je conclurai cette note de lecture en reprenant ce que j’écrivais au sujet de l'ouvrage de 2014 : la force pédagogique de la démarche de l’A. réside peut-être surtout dans le fonctionnement de l’attelage maîtrise technique/vigilance stratégique. Car, c’est bien connu, précision technique sans perception stratégique (la sienne propre mais aussi celle de l’outil) n’est que ruine…

 

Comparez et maîtrisez les moteurs de recherche / Bruno-Bernard Simon. - Paris : Éditions Klog, 2019. - 295 p. - ISBN : 979-10-92272-29-1

Bruno Richardot, janvier 2021
Note de lecture rédigée pour l'ADBS


1 Vos recherches avec Google / Bruno-Bernard Simon. - Paris : Éditions Klog, 2014. - 162 p. - ISBN 979-10-92272-01-7.

2 https://www.webrankinfo.com/dossiers/etudes/parts-marche-moteurs#france (consulté le 15 janvier 2021). On notera, à l’occasion, que le score de Google a légèrement baissé depuis juillet 2019, dont l’A. donne les chiffres (p.17).

3 Cf. Les 500 mots métiers. Bibliothèques, archives, documentation, musées / Jean-Philippe Accart & Clotilde Vaissaire-Agard. - Paris : Klog éditions, 2016 - 192 p. - ISBN : 979-10-92272-11-6. Cet ouvrage, épuisé, fera l’objet d’une nouvelle édition en 2021.

4 Il en va de même pour l’introduction qui reprend, en la complétant, celle de l’ouvrage de 2014.

6 Notre A. espère que, “dans son système R&D, Google couve quelques idées de développement sur le sujet de la synonymie pour l’avenir” (p.152).

7 Small is beautiful. Une société à la mesure de l’Homme, Paris, Le Seuil, Coll.Points, 1979, p.74.

8 En octobre 2014, Framasoft a lancé sa campagne “Dégooglisons Internet” (https://degooglisons-internet.org/fr/), mentionnée à plusieurs reprises dans notre ouvrage.


 

Posté par brich59 à 18:23 - - Commentaires [0] - Permalien [#]
Tags : ,