Le problème des mégadonnées (big data) n’est pas récent en soi. Il existait déjà du seul fait de manquer de temps pour prendre connaissance de tout ce qui mérite de l’être. Ce qui est récent c’est surtout l’ampleur du phénomène. L’accès aux informations est très facilité par Internet pour un très grand nombre de personnes qui ne pouvaient y avoir accès auparavant. Cependant Internet est à la fois remède et poison puisque, s’il permet plus d’accessibilité aux données, il a aussi pour effet de multiplier les données au-delà de tout ce qu’on pouvait imaginer jusque-là, y compris celles que nous générons nous-mêmes. En fait, Pierre Lévy semble avoir raison d’affirmer que, dans les décennies à venir, il y aura bien plus de données encore mais aussi des outils plus puissants pour les analyser, qui seront en outre, démocratiquement, accessibles à tous. Parmi ces outils, figure le modèle idéométrique de l’enfant[2] qui, précisément, semble lui donner raison sur ce point. Ce modèle transpose le problème des mégadonnées au niveau individuel.

Toute personne reçoit bien plus d’informations par ses sens qu’elle n’en retient et n’en a besoin. Dans le cas d’un jeune enfant, c’est la même chose avec la différence que son cerveau se développe de façon particulièrement rapide. D’une part, son cerveau en croissant reçoit et traite de plus en plus d’informations mais, d’autre part, il devient en même temps capable d’en traiter utilement de plus en plus. Donc sa situation est analogue à celle de l’humanité d’aujourd’hui, qui reçoit et traite de plus en plus d’informations, mais qui, en même temps, se dote de moyens de plus en plus puissants pour les analyser et les utiliser. Cependant, au stade de développement qui correspond à son âge – 18 mois, supposerons-nous ici –, l’une des caractéristiques de l’enfant est son développement intellectuel rapide. En outre, ce qui est vraiment nouveau à ce stade est la capacité de se décentrer de lui-même grâce aux connaissances qu’il peut acquérir par le moyen du langage avec la ou les personnes de son environnement immédiat. Justement, le métalangage IEML créé par Pierre Lévy à l’usage de l’humain en général se trouve à correspondre à cette capacité toute nouvelle de l’enfant. Examinons le tableau suivant.

 Structure complète  Type de mégadonnées  Type de langage émergent 
Humanité actuelle Mégadonnées générées par Internet Métalangage(fondé sémantiquement)
Enfant (de 18 mois) Données produites ou générées par les organes sensoriels et le cerveau Langue naturelle(fondée biologiquement)
Cellule Pullulement des macromolécules        (« soupe primordiale » Code génétique(fondé physiquement)
Atome État dispersé et désordonné de la matière(« équilibre thermique de l’univers primordial ») Numéro atomique(fondé mathématiquement)

Figure 1 : Tableau des formes de mégadonnées et du langage

en fonction du type de structure complète émergente

Ce tableau donne un aperçu de la puissance de l’idéométrie en tant qu’outil de vulgarisation créatrice, en même temps qu’instrument d’approfondissement de la compréhension du monde. Il génère également un problème d’interprétation quant à la signification réelle de telles correspondances entre des domaines aussi éloignés entre eux.

La « structure complète » est l’expression utilisée ici afin de désigner trois concepts scientifiques de base, respectivement, de la physique, de la biologie et des sciences humaines, soit l’atome, la cellule et l’être humain. Dans le tableau, l’être humain est en l’occurrence un jeune enfant. De plus, une quatrième structure complète a été surajoutée de façon hypothétique, soit l’humanité actuelle en tant que prolongement naturel de la séquence. Dans leurs champs respectifs, ils jouent chacun le rôle de l’élément constitutif de la réalité physique, biologique ou humaine. Ces trois structures complètes ne se correspondent pas sur la base d’une ressemblance ni de traits qualitatifs communs. Elles se correspondent dans leur rapport à l’ensemble d’un ordre de réalité, lequel est compris en fonction de différences avec d’autres niveaux du réel.

L’humanité actuelle connaît de plus en plus le problème du big data au sens propre. Elle prend peu à peu conscience de ce qui lui manque pour surmonter ce problème, qu’elle tend à voir comme un défi à relever plutôt qu’un problème insoluble.

Au niveau cellulaire, ce qui correspond aux mégadonnées se trouve dans le désordre des macromolécules, dans la soupe originelle[3], avant que n’apparaissent celles qui sont auto-réplicatives, comme les molécules de type ADN. Ces nouvelles macromolécules, en se reproduisant de plus en plus, sont ainsi parvenues à devenir assez nombreuses pour limiter le « bruit » fait par les autres.

Au niveau atomique, la situation est semblable à celles du niveau cellulaire à ceci près que les atomes n’ont aucune propriété similaire à celle d’autoréplication. Elles en ont cependant l’équivalent par leur stabilité relative, liée au numéro atomique. Elles se sont donc multipliées aux dépens des pseudo-structures de particules trop éphémères, comme par exemple le doublet de neutrons ou le doublet de protons, alors que par exemple la réunion d’un proton et d’un neutron, soit le deutérium, avait suffisamment de stabilité pour se multiplier.

[2] Ce modèle sera expliqué plus bas, dans cet article.

[3] Plusieurs expressions synonymes ou similaires sont employées: “soupe primordiale », « soupe primitive », etc.