7 septembre 2019

Blog

Les algorithmes qui écrivent pour nous les notes de bas de pages ... ; est-ce ainsi que l'on doit "procéder" ?

par Marie-Anne Frison-Roche

Lisant sur mon écran d'ordinateur un article en accès libre dans une revue en partie librement accessible numériquement, une mention attire mon attention.

Elle a de quoi laisser perplexe toute personne qui écrit des articles et ouvrage qui requiert des lectures, lectures dont on indique au lecteur la trace pour l'inviter à son tour à y procéder dans ses propres recherches. Dans des travaux de recherche, de découverte et d'interrogation, donc.

Voilà le texte de la mention. :

 

Des DOI (Digital Object Identifier) sont automatiquement ajoutés aux références par Bilbo, l'outil d'annotation bibliographique d'OpenEdition.
Les utilisateurs des institutions abonnées à l'un des programmes freemium d'OpenEdition peuvent télécharger les références bibliographiques pour lesquelles Bilbo a trouvé un DOI.

"sont automatiquement ajoutés" ?

Il s'agit littéralement d'un "outil d'annotation bibliographique" ?

Si l'on s'abonne (le prix n'est pas indiqué, mais quand on écrit "-ium", c'est pour dire que l'on sort du gratuit...; comme le fait l'entreprise américaine Academia qui propose rapidement de "upgrapder" par un service payant pour accéder ), automatiquement les références seront téléchargées dès l'instant que l'algorithme, répondant au nom de "Bilbo" (n'est-ce pas le nom d'un personnage dans Le seigneur des anneaux ?), mais qui dans le civil a un nom qui reproduit sa fonction (Digital Object Identifier) fonction exprimée en langue anglaise va "automatiquement ajouter" une référence aux autres références qui auront été tacquées par l'algorithme.

Est-ce raisonnable ? Est-ce efficace ? Est-ce sans danger ?

C'est mécaniquement efficace, dès l'instant que l'on conçoit la référence bibliographique comme un "entassement mécanique" (I). Mais la référence bibliographique est et doit être tout autre chose, ce que les machines ne peuvent en rien restituer : être le reflet du parcours intellectuel que l'être humain qui écrivit l'article ou l'ouvrage fit pour écrit ce texte-là, une invitation à la lecture (et les machines ne lisent pas, on en arrive aujourd'hui à devoir le rappeler). Cette définition qui fut partagée de la bibliographie, qui ne mesure pas l'ampleur de l'empilement mais dessine ce vers quoi l'auteur s'est tourné pour chercher, pour trouver des réponses aux questions qu'il s'est posées, cela seul une personne peut le faire. En rien "Bilbo" (II). Or, si l'on se repose sur celui-ci, contre un abonnement, pour faire cette tâche-là, qui n'est reflet de rien, non seulement la bibliographie ne sera plus rien, mais des effets pervers, comme ceux observés comme celui des "citations", vont s'accroître (III).

Ensuite, si Bilbo écrit les bibliographie, tandis que Sophia fait les conférences, pourquoi un autre algorithme, que l'on pourrait appeler Thesarus ne pourrait pas écrire thèse, livre, essai, article, en ayant compilé toutes les règles formelles à respecter. Pourquoi non ? On se souviendra alors que les machines et les suites de chiffres ne lisent pas, n'écrivent pas, ne conçoivent pas, n'apprennent pas (l'expression Learning machine est un oximore), ne mémorisent pas (la "mémoire" d'un ordinaire n'est qu'une image), ne traduisent pas, n'ont pas d'émotion, n'aiment pas. Seuls les êtres humains le peuvent. Le sait-on encore ? 

 

Lire ci-dessous une analyse plus détaillée.

I. LA REFERENCE BIBLIOGRAPHIQUE COMME ENTASSEMENT MECANIQUE : CE QUE PEUT FAIRE UNE MACHINE MIEUX QU'UNE PERSONNE 

A lire cette mention, l'on comprend que l'algorithme va aller chercher les références et en fonction des mots va additionner, peut-être en les proposant préalablement à l'auteur, telle et telle document (écrit, vidéo, etc.). Plus besoin d'aller en bibliothèque, il suffit de "télécharger les références bibliographiques" pour lequel l'algorithme a repéré un objet sur lequel la personne fait un recherche. 

Comme l'algorithme n'a pas de "projet" et ne "cherche" pas un document en vue d'en produire un nouveau, ce que fait un être humain qui désire par exemple écrire un texte, la machine procéde par coïncidence : la sophistication du procédé ne change pas la nature du procédé. Ainsi et par exemple une personne qui veut une bibliographie sur la responsabilité du banquier gestionnaire d'un portefeuille de titres, dont des contrats d'assurance-vie, obtiendra toutes les "références" de ce qui a été écrit à ce propos. 

Dans ce repérage, à la fois en texte intégral et en mots-clés, une machine va aller plus vite, peut entasser plus, conserver mieux, perfectionner, classer par plusieurs modes, proposer des dossiers, organiser des partages, construire des plateformes d'échange.

L'efficacité est de son côté.

C'est ainsi que les concepteurs de ce type d'outil exposent - et on peut les suivre - que ces outils non seulement aident la recherche, mais encore la partage (car la personne peut entrer en contact avec d'autres qui se posent des questions sur la responsabilité du banquier, ou avec ceux qui s'interrogent sur l'avenir de l'assurance-vie) ; mieux, il démocratisent la recherche car la personne isolée, dans un pays lointain, peut par un clic connaître ces listes, loin de toute bibliothèque. 

C'est vrai, mais à quoi sert une bibliographie ?

L'on trouve désormais, notamment dans les thèses, des listes de bibliographies qui occupent des dizaines de pages. 

Les articles sont souvent enrichis, certains diraient "lestés" de références bibliographiques de références de tous les commentaires qui, par dizaines, ont accompagné les décisions ou les lois. 

Quand on lit les thèses anciennes, il y a peu de pages. L'auteur était-il moins savant ? Le travail moins fondé ? La lecture moins utile ? Par exemple les livres de Bergson ont peu de référence ; les thèses de Flour de Motulsky n'en ont quasiment pas.

Pourquoi entasser des références bibliographiques ? Si cela est un outil, à quoi nous est-il utile ?

 

II. LA REFERENCE BIBLIOGRAPHIQUE, REFLET DE LA RECHERCHE PARCOURUE : EN TRAIN DE SE PERDRE ? 

La bibliographie n'est pas un entassement de tout ce qui peut se rapporter à un sujet. 

Elle ne consiste pas à viser un mot, ou chaque mot, ou les mots par analogie, comme le fait par exemple site Academia, pour proposer mécaniquement par arborescence des lectures. Procéder ainsi c'est non seulement laisser la machine entasser par identité de terme sans compréhension de celui-ci (comment une machine pourrait-elle "comprendre" ?), mais c'est laisser la machine guider la recherche. 

Procéder par analogie mécanique, l'entassement se fait par famille de mots. Ainsi le lecteur doté de l'outil numérique ne sort plus de la famille de mots. C'est bien la machine qui tient les guides, qui tient les rênes de la recherche.

Mais une recherche, quelque qu'elle soit, est d'abord un projet. 

L'auteur, et c'est avant en celà qu'il est un "auteur", qu'il est doté d'un "droit" qui lui est si particulier, le "droit d'auteur", a un projet qui lui est particulier : une idée qu'il va déployer dans un mécanisme comme l'écriture, laquelle s'appuie  - si nous sommes dans une entreprise savante - sur une réalité visée par des références et parfois - s'il est modeste - sur des réflexions qu'ont eu d'autres auteurs avant ou à côté de lui.

Ces auteurs, il les a rencontrés en chemin, sur la route de son propre travail. Ils n'étaient pas là au départ. Ils sont venus au fur et à mesure que sa pensée, qui s'achevera dans l'article fini, qui reprendra sa route dans l'article suivant, prenait forme.

Ainsi la bibliographie ne peut jamais être donnée au départ par une machine, parce qu'elle est le reflet du cheminement de l'esprit de l'auteur.

Si elle est le reflet du logiciel Bilbo , alors non seulement on peut craindre l'absence de l'aventure de cet esprit, mais plus encore le recours à cet outil va bloquer cette aventure-là, puisque les références apportées à foison par l'algorithme va bloquer l'auteur dans un chemin déjà tout tracé : tout ce qui ressemble déjà à ce qui est écrit. 

Tout est fait pour exclure le nouveau. 

Or, la création par définition, même en matière savante, devrait être et l'esprit d'aventure et la découverte de nouveau, parce que l'auteur a rencontre un fait qu'il ignorait, un auteur qui n'appartient pas à sa discipline, une oeuvre peu citée (et que donc l'algorithme ne va pas repérer, lui qui fixe les références par effet de masse). 

La bibliographie, qui devrait être le reflet du chemin de l'auteur qui a été de découverte en découverte pour écrite, est de plus en plus remplacée par des tombereaux de références construites par des outils de répérages, qui non seulement ne disent plus rien du travail de recherche et plus encore bloquent celle-ci. 

Et pourquoi s'arrêter à cela ? 

 

III. LES DANGERS D'UNE CONCEPTION MECANIQUE DE L'ECRITURE SAVANTE

La technologie est fiable. 

Par recoupement et entassement de données à jamais conservés, des bibliographies sont établies sur des pages et des pages, dans toutes les langues et sur tous les sujets. Les algorithes de traduction automatiques seront des supports pour aboutir à des bibliographies universelles sur n'importe quel sujet.

La première chose qui va se passer est le prolongement du phénomène des "citations". 

En effet, la bibliographie n'est jamais qu'un mode particulier de citations.

Or, les "citations" sont aujourd'hui un mode d'évaluation des personnes, qui doivent leur carrière et leur avancement, au fait d'être "citées" ou de ne l'être pas... Si des logiciels font les bibliographies, ils font les citations. L'investissement dans les écritures des citations est rentable s'il permet de rendre visible les personnes, de faire fructifier leur carrière, de valoriser la structure universitaire à laquelle ils appartiennent.

Du système des "citations", on a souligné les avantages, notamment l'objectivité que cela présenterait ; Alain Supiot en a démontré l'inconvénient dans La gouvernance par les nombres, puisque l'auteur ne vaut plus que par le nombre de fois où il est cité, que par le nombre de fois où Bilbo va l'insérer dans les bibliographies mécaniquement élaborées.

Mais pourquoi s'arrêter en si bon chemin ?

La seconde évaluation peut être la rédaction par un logiciel d'articles savants formellement irréprochables

Les écrits universitaires répondent à des standarts.

Un certain volume matériel. Des annonces de plan. Une insertion dans une discipline. Un appareil bibliographique (ça, c'est déjà fourni), un objet, des informations, des constructions-type (le logiciel Word en propose à travers des tables de matières automatique prédéfinies). 

Il doit être assez aisé de proposer un logiciel qui construirait des phrases exposant, par exemple en matière juridique, l'état du Droit (ce qu'un logiciel de Regtech doit pouvoir fournir), ou en matière économique ce qu'il est convenu d'appeler "l'état de la littérature", qui est une présentation synthétique des travaux et réflexions : un logiciel de bibliographie automatique 0.2. devrait pouvoir faire cela. Les annonces de plan devraient également être automatisés. 

Les traductions devraient pouvoir être automatiques.

Certes, l'invention n'a pas place ; reste juste celle pour la signature de la personne qui a acheté une licence pour l'usage d'un tel logiciel.

Mais de cela, qui s'en soucie. 

____

 

les commentaires sont désactivés pour cette fiche