Le mot émergence me poursuit depuis hier soir, il s’est enfoui dans mon sommeil, peut-être dans mes rêves, dans mes cauchemars. Je n’y ai pas fait attention tout de suite. Au début, il devait être dissimulé parmi tous les mots d’une phrase. Et ce n’est que ce matin, en descendant faire le café, que j’ai comme des flashs, que des choses émergent, comme issues des profondeurs d’un océan de stupeur. Des structures.

En fait, j’ai découvert SpaCy hier en fin de journée, et les premiers résultats obtenus avec deux ou trois scripts Python sont bluffants. Il faudra que je fasse un récapitulatif de tout ce que l’on peut faire avec cet outil. Avec seulement un script, j’ai trié parmi 433 articles ceux traitant de l’écriture, créant d’abord un document de 1 500 pages, puis un autre, réduit à 34 pages en extrayant l’essentiel. Enfin, en regroupant les phrases par thématique, j’ai obtenu un texte de 500 pages, à la fois effarant et fascinant.

SpaCy, c’est une bibliothèque Python dédiée au traitement du langage naturel. Un outil qui permet d’analyser, de trier, de structurer des textes. Avec SpaCy, il devient possible d’extraire des entités clés dans un texte, de reconnaître des motifs récurrents, ou encore de transformer un chaos de phrases et de textes en une organisation disons un peu plus claire. Pour quelqu’un comme moi, passionné par les mots et les structures qu’ils créent, cet outil ouvre des perspectives vertigineuses. Ce n’est pas seulement un programme informatique, c’est presque un assistant littéraire.

Ce qui m’épate, c’est la manière dont un outil purement algorithmique peut révéler la poésie cachée dans ce que je nomme généralement le désordre. Les mots, que l’on croit figés dans leurs usages, apparaissent alors dans de nouvelles configurations. Recomposés ainsi, mis en relation de façon inattendue, on croirait qu’ils ne m’appartiennent plus. Que c’est un autre qui les a écrits.

C’est comme si cet outil, SpaCy, m’offrait un point de vue nouveau, une possibilité de détachement supplémentaire vis-à-vis du langage, de ce que j’imagine souvent, à tort, m’appartenir : les mots et leur usage. Pas loin de me faire rêver, il me donne l’impression que ces mots, libérés de mes propres intentions, deviennent une matière vivante, presque organique. Comme si, sous l’œil de l’algorithme, les mots se déployaient dans une réalité qui m’échappe, réclamant une autonomie nouvelle. Est-ce que je leur ai insufflé cette vie toute neuve en les structurant, ou est-ce l’outil qui révèle ce que je n’aurais jamais vu seul ?

SpaCy m’a fasciné par sa capacité à fragmenter un texte en unités fondamentales (tokens). C’est comme si chaque particule que sont les mots, les espaces, les points, les virgules, reprenait vie avec cette impression d’autonomie que l’algorithme confère aux symboles qu’ils sont, en définitive. Ainsi, chaque mot, isolé de son contexte habituel, devient une particule élémentaire d’un langage en reconstruction. Ce qui me surprend le plus, c’est cette reconnaissance d’entités nommées. SpaCy semble voir dans le chaos des phrases ce que l’œil humain peine parfois à percevoir : des noms, des lieux, des frontières invisibles. Une sorte de cartographe algorithmique qui redessine les paysages intérieurs d’un texte.

L’autre dimension, tout aussi formidable, c’est la malléabilité de SpaCy. Non seulement il analyse, mais il s’adapte. On peut lui enseigner des nuances, lui demander d’affiner sa perception des mots, comme un élève doté d’une patience infinie. Le pipeline de SpaCy est une mécanique subtile. À chaque étape, il ajoute une couche de sens, comme si les mots passaient sous une série de lentilles successives, révélant leur texture, leurs contours, leurs interconnexions. Ce processus est assez proche de la distillation, où le brut devient limpide.

SpaCy mesure la similarité entre des mots, des phrases, des idées, avec une précision effarante. Cela me fait réfléchir : est-ce une nouvelle façon de percevoir le langage, dépourvue de notre subjectivité humaine ? Ces vecteurs, ces rapprochements calculés, ouvrent-ils une voie vers une compréhension plus universelle des mots, ou au contraire plus abstraite, plus étrangère ?

En cherchant une illustration pour ce billet je retombe sur cette photographie d’écorce de chène. L’écorce vue en gros plan a aussi quelque chose de fascinant. En s’approchant au plus près gràce à l’appareil photo on peut voir des détails qu’on ne voit généralement pas à l’oeil nu. De plus cette collaboration entre la technologie et l’intention humaine permet de créer des vues neuves ou inattendues de la réalité.