avril 2015 – Technique et R&D chez Yoocan par François Lemaire

Quelques définitions

Par science, on entend domaine de la connaissance, à différencier de la technologie, qui traite des outils et des techniques ; je parlerai donc ici de l’informatique comme domaine de connaissance, pas comme ensemble de pratiques et de techniques.

Pour caractériser une science, il faut déterminer son objet d’étude, sa méthodologie et la façon dont elle prouve ses résultats. Aussi ancienne que soit la science, répondre à cette question n’est jamais trivial. La physique est supposée comprendre et modéliser les phénomènes naturels, mais cette définition est tellement large qu’elle pourrait englober la chimie et la biologie ; cette dernière est supposée étudier le vivant, mais nous n’avons pas aujourd’hui de définition satisfaisante de ce qu’est la vie, et ainsi de suite. Y répondre pour l’informatique est tout aussi difficile.

L’objet d’étude

Trois objets sont susceptibles d’être l’objet de l’informatique : les algorithmes, les ordinateurs et les informations.

Le terme d’algorithme a gagné en popularité dans le grand public ces dernières années : il représente symboliquement la puissance de Google, les risques réels ou supposés des réseaux sociaux et du big data, voire plus récemment de l’intrusion de l’Etat dans les communications électroniques. Il possède une certaine charge magique qui ferait de nous informaticiens des égaux de Newton ou Einstein avec leurs lois universelles, génies aux pouvoirs mystérieux et absolus. Plus prosaïquement, un algorithme n’est guère plus qu’une recette de cuisine pour transformer un jeu de données entrant en un jeu de données sortant ; en tant que tel, son étude peut être passionnante, et d’une incroyable difficulté technique et conceptuelle – ceux qui auront tenté de démontrer qu’il n’existe pas d’algorithme de tri plus rapide que le quick sort sauront de quoi je parle. Mais aussi fondamentaux qu’ils soient en informatique, les algorithmes sont nés bien avant elle, et sont étudiés depuis bien longtemps par une branche des mathématiques, l’algorithmique ; leur formalisme et leur étude en empruntent toutes les caractéristiques. Ils ne peuvent être l’objet unique de la science informatique.

L’objet ordinateur a l’avantage d’être apparu peu ou prou en même temps que l’informatique. Celle-ci serait dans ce cas la science étudiant l’ordinateur en tant que dispositif de traitement automatisé des données – notez l’utilisation du terme données et pas du terme information, on va y venir – pour résumer, l’étude des machines de Turing. Comme l’indique le sous-titre de ce blog, je ne suis pas partisan de définir l’informatique par l’outil ordinateur : d’une part, cela tend à la réduire à un ensemble de technologies, or nous essayons de la définir en tant que science, et d’autre part, en elle-même, sans algorithme, sans les données introduites et les données attendues en sortie, la machine est inerte.

L’information est à différencier de la donnée en ce qu’elle regroupe deux réalités : les données proprement dites, et leur mise en forme. La donnée est objective, c’est elle que traite la machine ordinateur ; l’information est subjective en ce que la mise en forme des données est interprétée humainement. Pour comprendre la différence, il suffit de penser par exemple aux sondages : le nombre de personnes choisissant une réponse à une question est une donnée ; ce que ce nombre dit de la réalité de la population sondée est une information, sujette à l’interprétation du sens de la question, du sens de la réponse dans le cadre de la question, de la situation du répondant quand on lui pose la question, etc. Telle que définie ici, elle est un objet d’étude original qu’aucune autre science n’aborde centralement : la linguistique étudie les messages exprimés dans les langues humaines, mais par définition tend à ignorer l’objectivité de la donnée sous-jacente qui dans son domaine est une illusion ; les mathématiques jouent avec les données, mais ne s’intéressent pas au sens subjectif que les humains leur affectent. De plus, la dualité donnée objective – interprétation humaine subjective représente bien la problématique rencontrée en permanence par les informaticiens qui est d’optimiser un processus existant à l’aide des ordinateurs – voire sans parfois.

C’est pourquoi, si je devais définir un objet unique d’étude de l’informatique, ce serait l’information ; raison également pour laquelle j’apprécie particulièrement le mot français informatique, quand les américains parlent plutôt de computer science – un reflet de leur culture utilitariste ?

Méthodologie et preuve

Malgré les bons arguments que l’on peut donner pour affirmer que l’objet de l’informatique est l’étude des informations, dès qu’on se penche sur la méthodologie informatique et sa façon de prouver la pertinence de ses résultats, les algorithmes et les machines reviennent en force.

En effet, il s’agit ici de démontrer qu’un traitement de l’information est conforme formellement aux demandes exprimées initialement par des humains. Ces demandes peuvent revêtir plusieurs formes : que les informations en sortie correspondent bien aux entrées et aux traitements demandés, ce qui fait appel à l’algorithmique ; que les traitements respectent des impératifs de rapidité, ce qui fait appel à l’expérimentation sur les machines. La qualité des traitements ne peut pas toujours se passer de l’interprétation humaine – d’aucuns dirait rarement – or si on savait modéliser correctement un humain, ça se saurait ; on peut prendre l’exemple de la vallée de l’étrange pour les robots où le ressenti humain est le cœur de la recherche. Dans ces cas, l’expérimentation sur des machines physiques est indispensable et l’ingrédient humain rend la preuve formelle difficile voire impossible.

La spécificité de la méthodologie informatique est de combiner les outils algorithmiques et les preuves empiriques par déploiement des traitements sur des machines physiques en une approche commune.

En conclusion, je pense que l’informatique traite un sujet original avec une approche elle aussi fondamentalement originale ; les objections légitimes à ce fait sont applicables à toutes les sciences du réel – la Physique moderne n’existerait pas sans les mathématiques, la Biologie s’appuie sur la Chimie, la Chimie sur la Physique, etc. Gageons qu’en mûrissant – 70 ans est très jeune pour une science, la plupart des concepts scientifiques mettent plus d’un siècle à percer dans la société civile – son objet et ses méthodes se cristalliseront de façon incontestable.

Mois : avril 2015

L’informatique est-elle une science ?

Quelques définitions

L’objet d’étude

Méthodologie et preuve

Des outils et des hommes