{"id":772,"date":"2015-02-23T15:12:30","date_gmt":"2015-02-23T15:12:30","guid":{"rendered":"https:\/\/gsara.tv\/causes\/?p=772"},"modified":"2015-02-25T15:31:11","modified_gmt":"2015-02-25T15:31:11","slug":"moteurs-recherche-regne-cyclopes-oeilleres","status":"publish","type":"post","link":"https:\/\/www.causestoujours.be\/moteurs-recherche-regne-cyclopes-oeilleres\/","title":{"rendered":"Moteurs de recherche : le r\u00e8gne des Cyclopes \u00e0 \u0153ill\u00e8res"},"content":{"rendered":"<p><strong>\u00ab <em>Tout le monde a le droit de parler, mais reste \u00e0 savoir qui sera entendu<\/em> \u00bb<\/strong><\/p>\n<p><strong>Comme pour une r\u00e9daction lors d\u2019un examen de philo, c\u2019est de cette phrase d\u2019Aaron Swartz qu\u2019est partie ma r\u00e9flexion sur les libert\u00e9s des internautes en particulier la libert\u00e9 d\u2019expression et d\u2019acc\u00e8s \u00e0 l\u2019information. Je me dois d\u2019abord de vous pr\u00e9senter l\u2019auteur de cette r\u00e9plique : Aaron Hillel Swartz (n\u00e9 le 8 novembre 1986 \u00e0 Chicago, mort le 11 janvier 2013 \u00e0 New York) est un informaticien am\u00e9ricain, \u00e9crivain, meneur politique et militant de l\u2019Internet. Il s\u2019est impliqu\u00e9 dans le d\u00e9veloppement du format de flux Web RSS, l\u2019organisation Creative Commons, le cadriciel de site Web <a href=\"https:\/\/webpy.org\/\">webpy.org<\/a> et le site d\u2019actualit\u00e9s Reddit. Les travaux de Swartz ont \u00e9galement port\u00e9 sur la sociologie, l\u2019\u00e9ducation civique et l\u2019activisme (merci, Wikipedia). Je ne saurais par ailleurs que trop vous conseiller le documentaire qui lui a \u00e9t\u00e9 consacr\u00e9 <em><a href=\"https:\/\/www.youtube.com\/watch?v=vXr-2hwTk58\">The Internet\u2019s Own Boy<\/a><\/em>.<br \/>\n<\/strong><br \/>\nMais revenons-en \u00e0 nos moutons. Beaucoup d\u2019hypocrisie r\u00e8gne dans nos soci\u00e9t\u00e9s concernant les libert\u00e9s sur Internet. Combien sont-ils \u00e0 s\u2019offusquer et crier au scandale quand un \u00c9tat (totalitaire) bloque l\u2019acc\u00e8s \u00e0 certains sites, blogs ou r\u00e9seaux sociaux\u00a0 ? Le mois dernier encore, la justice turque mena\u00e7ait d\u2019interdire totalement l\u2019acc\u00e8s \u00e0 Facebook depuis la Turquie si la compagnie ne bloquait pas un certain nombre de pages relayant des contenus consid\u00e9r\u00e9s comme offensants. \u00d4 d\u00e9cisions liberticides. Certes nous n\u2019avons pas Erdogan, mais nous avons quelque chose de bien plus insidieux et peut-\u00eatre plus \u00ab efficace \u00bb dans la normalisation de la pens\u00e9e. J\u2019ai nomm\u00e9 Google. Le but n\u2019est pas ici de faire le proc\u00e8s du mastodonte des moteurs de recherche, mais plut\u00f4t de remettre en cause la f\u00e2cheuse tendance de la majorit\u00e9<sup><a id=\"ref1\" href=\"#fn1\">1<\/a><\/sup> (moi y compris) \u00e0 l\u2019utiliser les yeux ferm\u00e9s, m\u00fb par une foi in\u00e9branlable en son omniscience et s\u2019imaginant que son seul but est de nous mener vers les voies de la connaissance.<\/p>\n<div id=\"attachment_881\" style=\"width: 650px\" class=\"wp-caption alignnone\"><a href=\"https:\/\/gsara.tv\/causes\/wp-content\/uploads\/2015\/02\/alaclair.jpg\"><img loading=\"lazy\" decoding=\"async\" aria-describedby=\"caption-attachment-881\" class=\"wp-image-881 size-full\" src=\"https:\/\/gsara.tv\/causes\/wp-content\/uploads\/2015\/02\/alaclair.jpg\" alt=\"\" width=\"640\" height=\"640\" srcset=\"https:\/\/www.causestoujours.be\/wp-content\/uploads\/2015\/02\/alaclair.jpg 640w, https:\/\/www.causestoujours.be\/wp-content\/uploads\/2015\/02\/alaclair-150x150.jpg 150w, https:\/\/www.causestoujours.be\/wp-content\/uploads\/2015\/02\/alaclair-300x300.jpg 300w, https:\/\/www.causestoujours.be\/wp-content\/uploads\/2015\/02\/alaclair-210x210.jpg 210w\" sizes=\"auto, (max-width: 640px) 100vw, 640px\" \/><\/a><p id=\"caption-attachment-881\" class=\"wp-caption-text\"><a href=\"https:\/\/alaclair.com\/pkj4drtgvpm7eecl-oignon\/\">alaclair.com\/deep-web\/<\/a><\/p><\/div>\n<p>&nbsp;<\/p>\n<h2>L\u2019arbre qui cache la for\u00eat<\/h2>\n<p>Ce que nous, navigateurs lambda, connaissons du Web, n\u2019est en fait qu\u2019une toute petite partie de celui-ci. La pointe de l\u2019iceberg pour reprendre une m\u00e9taphore tr\u00e8s utilis\u00e9e pour expliquer les notions de Web surfacique et Web profond (\u00e0 cela s\u2019ajoute encore, entre autres, le dark Web mais faute de scaphandre et de temps, nous ne descendrons pas si bas dans les Abysses de l\u2019Internet). Ce Web profond est constitu\u00e9 de toutes les pages potentiellement indexables par les moteurs de recherche mais qui ne le sont pas bien souvent pour des raisons techniques (manque de liens retours, erreurs dans le code HTML, besoin d\u2019un identifiant, langage ignor\u00e9 des moteurs de recherche, etc.) Cette partie non index\u00e9e du Web serait, selon une \u00e9tude de juillet 2001 r\u00e9alis\u00e9e par l&rsquo;entreprise <span class=\"lang-en\" lang=\"en\" xml:lang=\"en\">BrightPlanet, <\/span>500 fois plus vaste que ce \u00e0 quoi les moteurs de recherche nous donnent acc\u00e8s. Son contenu n\u2019est d\u2019ailleurs pas fait que de choses viles et douteuses, on y trouve des milliers de ressources de grande valeur valid\u00e9es par des experts faisant autorit\u00e9 dans leurs domaines respectifs. Enfin bref, pour l\u2019omniscience de Google et ses concurrents il faudra donc repasser. Si sur ces contraintes techniques je ne demanderai pas \u00e0 Google de faire son <em>mea culpa<\/em>, je m\u2019interroge par contre, sur sa mani\u00e8re de classer les \u00ab quelques \u00bb sites qui restent, car dans ce <em>Web visible<\/em> il existe bien des niveaux de visibilit\u00e9. Surtout quand on sait que la population qui d\u00e9passe la 3e page de r\u00e9sultats est assez restreinte.<\/p>\n<h2>Le colibri et le pigeon<sup><a id=\"ref2\" href=\"#fn2\">2<\/a><\/sup><\/h2>\n<p>Au commencement \u00e9tait l\u2019algorithme \u2014 cette formule math\u00e9matique qui trie toutes les donn\u00e9es stock\u00e9es dans l\u2019index du moteur de recherche en fonction de votre requ\u00eate \u2014 suivi du sacrosaint <em>PageRank<\/em><sup><a id=\"ref3\" href=\"#fn3\">3<\/a><\/sup>. Lorsqu\u2019un document est point\u00e9 par de nombreux hyperliens, son <em>PageRank<\/em> augmente. Plus le <em>PageRank<\/em> est \u00e9lev\u00e9, plus il aura de chances d\u2019\u00eatre affich\u00e9 dans les premiers r\u00e9sultats d\u2019une recherche. Ce syst\u00e8me donne une indication de la \u00ab popularit\u00e9 \u00bb du document parmi les autres documents du Web. Bien que cette notion de popularit\u00e9 soit discutable, le <em>PageRank<\/em> a n\u00e9anmoins donn\u00e9 lieu \u00e0 un immense concours de zizi 2.0 pour se retrouver dans le haut du classement. Sans compter que ce sont les premiers r\u00e9sultats qui seront le plus consult\u00e9s et donc potentiellement les plus recit\u00e9s, ce qui ne fera que conforter leur position. L\u2019un des gros probl\u00e8mes de ce syst\u00e8me, c\u2019est que pour se faire une place au soleil, les cr\u00e9ateurs de contenus sont pr\u00eats \u00e0 ce que leurs sites deviennent conformes aux r\u00e8gles des engins de recherche et non plus dirig\u00e9s (en priorit\u00e9) vers les utilisateurs. Google met tr\u00e8s r\u00e9guli\u00e8rement son algorithme \u00e0 jour pour le rendre plus performant, si bien qu\u2019il se voit aujourd\u2019hui comme un moteur de r\u00e9ponses, pr\u00e9tendant anticiper les d\u00e9sirs de ses utilisateurs. Peut-\u00eatre, mais quand je recherche une information et que j\u2019ai besoin de faits, si tout ce que j\u2019ai est une r\u00e9ponse qui \u00ab correspond \u00bb \u00e0 mon syst\u00e8me de pens\u00e9e et me conforte dans ce que je sais d\u00e9j\u00e0, je n\u2019aurais pas pris la peine d\u2019allumer mon ordinateur. Je ne parle pas trouver l\u2019heure d\u2019ouverture de la piscine communale ou une recette simple et rapide de falafels, mais de ces choses de la sph\u00e8re scientifique, d\u2019opinion ou intellectuelle (appelez \u00e7a comme vous voudrez) un peu laiss\u00e9es de c\u00f4t\u00e9. Et puis, vu le nombre de publicit\u00e9s pour des bottes fourr\u00e9es dont je suis bombard\u00e9e, \u00e7a fait un bon moment que je me suis dit que les mecs de l\u2019autre c\u00f4t\u00e9 de l\u2019\u00e9cran n\u2019avaient pas compris grand- chose \u00e0 la teneur de mes envies.<\/p>\n<h2>Le fric c\u2019est clic<\/h2>\n<p>Parlons un peu business. J\u2019\u00e9voquais quelques lignes plus haut les contingences techniques qui emp\u00eachent certains sites d\u2019\u00eatre index\u00e9s. S\u2019il y a des sites hors normes, il doit bien y avoir quelqu\u2019un qui fixe la norme. C\u2019est pr\u00e9cis\u00e9ment ce que fait le <em>World Wide Web Consortium<\/em> (ou <em>W3C<\/em>). Parmi les 396 membres de ce club un peu s\u00e9lect : Apple, BlackBerry, eBay, Facebook, Microsoft et bien entendu Google. \u00ab Il faut bien comprendre que les grands financeurs du W3C ont pour principal objectif de rentabiliser leurs investissements et de rapporter le maximum de dividendes \u00e0 leurs actionnaires, et non pas de d\u00e9velopper l\u2019intelligence collective de l\u2019humanit\u00e9. Si leurs objectifs passent par une augmentation de l\u2019intelligence collective, tant mieux, ils ne sont pas contre a priori, bien s\u00fbr, sinon, tant pis ! \u00bb explique Pierre L\u00e9vy<sup><a id=\"ref4\" href=\"#fn4\">4 <\/a><\/sup>Le r\u00e9sultat : une orientation de la recherche tr\u00e8s ax\u00e9e sur ce qu\u2019on appelle le Click stream marketing, et donc le revenu par clic. En effet, les moteurs de recherches d\u2019entreprises priv\u00e9es ont surtout int\u00e9r\u00eat \u00e0 r\u00e9pertorier des liens tr\u00e8s fr\u00e9quent\u00e9s, car \u00e0 fort potentiel de revenus publicitaires. La petite devise du W3C \u00ab Leading the Web to its full potential \u00bb prend donc un sens bien moins philanthropique si son auteur avait des dollars dans les yeux en pensant \u00e0 ce potentiel. Mais le plus inqui\u00e9tant \u00e0 mon sens est la premi\u00e8re partie, \u00ab leading the web \u00bb \u00e0 la fois traduisible par \u00ab mener le Web \u00bb ou \u00ab diriger le Web \u00bb. Le monopole financi\u00e8rement int\u00e9ress\u00e9, quand il concerne l\u2019acc\u00e8s \u00e0 l\u2019intelligence collective, ne saurait \u00eatre une bonne chose.<\/p>\n<p>Dans le m\u00eame \u00e9tat d\u2019esprit, j\u2019aurais\u00a0 voulu vous parler de l\u2019illogisme contondant qu\u2019il y a \u00e0 faire payer des articles scientifiques issus de recherches financ\u00e9es par l\u2019argent public (un autre combat d\u2019Aaron Swartz). Mais l\u2019espace qui m\u2019est imparti me permettra seulement de conclure par cette phrase en r\u00e9ponse \u00e0 celle qui a pr\u00e9c\u00e9d\u00e9 ce pseudo pamphlet de noob semi-conscientis\u00e9e et inform\u00e9e : tout le monde a le droit de chercher, mais peu d\u00e9cident de ce que l\u2019on trouve.<\/p>\n<p><strong><span class=\"entity _586o\" data-icon=\"null\" data-select=\"group\" data-group=\"all\" data-fulltext=\"Maureen\u00a0Vanden\u00a0Berghe\" data-text=\"Maureen\u00a0Vanden\u00a0Berghe\" data-type=\"ent:user\" data-uid=\"601110818\" data-si=\"true\">Maureen\u00a0Vanden\u00a0Berghe<\/span><\/strong><\/p>\n<p><sup id=\"fn1\">1. [En Belgique en janvier 2015 95,34 % des utilisateurs de moteurs de recherche utilisaient Google \u2014 source StatCounter]<\/sup>\u21a9<br \/>\n<sup id=\"fn2\">2. [Colibri et Pigeon sont des param\u00e8tres suppl\u00e9mentaires de l\u2019algorithme de Google. Le premier serait capable de d\u00e9duire le<br \/>\ncontexte de votre recherche pour am\u00e9liorer les r\u00e9sultats. Le second lui am\u00e9liore les r\u00e9sultats en lien avec des localisations. \u00c0<br \/>\ncette animalerie nous pouvons \u00e9galement ajouter le Pinguin et le Panda qui sont eux des filtres de p\u00e9nalit\u00e9 ajout\u00e9s \u00e0<br \/>\nl\u2019algorithme de classement des r\u00e9sultats de Google pour punir des sites de \u00ab mauvaise qualit\u00e9 \u00bb.]<\/sup>\u21a9<br \/>\n<sup id=\"fn3\">3. [L\u2019algorithme tient \u00e9galement compte des termes figurants sur le site Web, le niveau d\u2019actualisation du contenu, votre<br \/>\nr\u00e9gion&#8230;]<\/sup>\u21a9<br \/>\n<sup id=\"fn4\">4. [Pierre L\u00e9vy est \u00e0 la fois philosophe et directeur de recherche, au Canada, d\u2019un projet de \u00ab m\u00e9talangage \u00bb permettant aux<br \/>\ninternautes de \u00ab coder le sens \u00bb et pas simplement les donn\u00e9es. Cette citation provient d\u2019une interview qu\u2019il a donn\u00e9e \u00e0<br \/>\n<em>Multitudes<\/em> pour l\u2019article \u00ab Au-del\u00e0 de Google. Les voies de l\u2019intelligence collective \u00bb.]<\/sup>\u21a9<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Beaucoup d\u2019hypocrisie r\u00e8gne dans nos soci\u00e9t\u00e9s concernant les libert\u00e9s sur Internet. Combien sont-ils \u00e0 s\u2019offusquer et crier au scandale quand un \u00c9tat (totalitaire) bloque l\u2019acc\u00e8s \u00e0 certains sites, blogs ou r\u00e9seaux sociaux  ? Le mois dernier encore, la justice turque mena\u00e7ait d\u2019interdire totalement l\u2019acc\u00e8s \u00e0 Facebook depuis la Turquie si la compagnie ne bloquait pas un certain nombre de pages relayant des contenus consid\u00e9r\u00e9s comme offensants. \u00d4 d\u00e9cisions liberticides. Certes nous n\u2019avons pas Erdogan, mais nous avons quelque chose de bien plus insidieux et peut-\u00eatre plus \u00ab efficace \u00bb dans la normalisation de la pens\u00e9e. J\u2019ai nomm\u00e9 Google.<\/p>\n","protected":false},"author":10,"featured_media":800,"comment_status":"closed","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[2,84],"tags":[],"class_list":["post-772","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-dossier","category-surveillance-self-defense"],"_links":{"self":[{"href":"https:\/\/www.causestoujours.be\/wp-json\/wp\/v2\/posts\/772","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.causestoujours.be\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.causestoujours.be\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.causestoujours.be\/wp-json\/wp\/v2\/users\/10"}],"replies":[{"embeddable":true,"href":"https:\/\/www.causestoujours.be\/wp-json\/wp\/v2\/comments?post=772"}],"version-history":[{"count":24,"href":"https:\/\/www.causestoujours.be\/wp-json\/wp\/v2\/posts\/772\/revisions"}],"predecessor-version":[{"id":891,"href":"https:\/\/www.causestoujours.be\/wp-json\/wp\/v2\/posts\/772\/revisions\/891"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/www.causestoujours.be\/wp-json\/wp\/v2\/media\/800"}],"wp:attachment":[{"href":"https:\/\/www.causestoujours.be\/wp-json\/wp\/v2\/media?parent=772"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.causestoujours.be\/wp-json\/wp\/v2\/categories?post=772"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.causestoujours.be\/wp-json\/wp\/v2\/tags?post=772"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}