L’intelligence artificielle découvre une physique alternative

Imbrications latentes de notre cadre colorées par des variables d’état physique. Crédit : Boyuan Chen/Columbia Engineering

un nouveau[{” attribute=””>Columbia University AI program observed physical phenomena and uncovered relevant variables—a necessary precursor to any physics theory. But the variables it discovered were unexpected.

Energy, Mass, Velocity. These three variables make up Einstein’s iconic equation E=MC2. But how did Albert Einstein know about these concepts in the first place? Before understanding physics you need to identify relevant variables. Not even Einstein could discover relativity without the concepts of energy, mass, and velocity. But can variables like these be discovered automatically? Doing so would greatly accelerate scientific discovery.

This is the question that Columbia Engineering researchers posed to a new artificial intelligence program. The AI program was designed to observe physical phenomena through a video camera and then try to search for the minimal set of fundamental variables that fully describe the observed dynamics. The study was published in the journal Nature Computational Science on July 25.


L’image montre un système de swingstick dynamique chaotique en mouvement. Notre travail vise à identifier et extraire le nombre minimum de variables d’état nécessaires pour décrire directement un tel système à partir d’images vidéo de grande dimension. Crédit : Yinuo Qin/Columbia Engineering

Les scientifiques ont démarré le système avec des images vidéo brutes de phénomènes physiques dont ils connaissaient déjà la solution. Par exemple, ils ont envoyé une vidéo d’un double pendule oscillant connu pour avoir exactement quatre “variables d’état”: l’angle et la vitesse angulaire de chacun de ses deux bras. Après plusieurs heures d’analyse, l’IA a donné sa réponse : 4.7.

“Nous pensions que cette réponse était assez proche”, a déclaré Hod Lipson, directeur du Creative Machines Lab du Département de génie mécanique, où le travail a été principalement effectué. « Surtout parce que toutes les IA avaient accès à des séquences vidéo brutes, sans aucune connaissance en physique ou en géométrie. Mais nous voulions savoir quelles étaient réellement les variables, pas seulement leur nombre. »

Ensuite, les chercheurs sont passés à la visualisation des variables réelles identifiées par le programme. Il était difficile d’extraire les variables elles-mêmes parce que le programme ne peut pas les décrire d’une manière intuitive que les gens comprennent. Après quelques recherches, il s’est avéré que deux des variables choisies par le programme correspondaient vaguement aux angles des bras, mais les deux autres restent un mystère.

“Nous avons essayé de corréler les autres variables avec tout ce à quoi nous pouvions penser : les vitesses angulaires et linéaires, l’énergie cinétique et potentielle, et diverses combinaisons de quantités connues”, explique Boyuan Chen PhD ’22, aujourd’hui professeur adjoint à l’Université de Groningue. Duke University qui a dirigé les travaux. “Mais rien ne semblait correspondre parfaitement.” L’équipe était convaincue que l’IA avait trouvé un ensemble valide de quatre variables, car elle faisait de bonnes prédictions, “mais nous ne comprenons pas encore le langage mathématique qu’elle parle”, a-t-il expliqué.


Boyuan Chen explique comment un nouveau programme d’IA a observé des phénomènes physiques et découvert des variables pertinentes – un précurseur nécessaire à toute théorie physique. Crédit : Boyuan Chen/Columbia Engineering

Après avoir validé un certain nombre d’autres systèmes physiques avec des solutions connues, les scientifiques ont saisi des vidéos de systèmes pour lesquels ils ne connaissaient pas la réponse explicite. L’une de ces vidéos mettait en vedette un « danseur de l’air » faisant signe de la main devant un parking de voitures d’occasion local. Après plusieurs heures d’analyse, le programme a retourné 8 variables. De même, une vidéo d’une lampe à lave a également produit 8 huit variables. Lorsqu’ils ont fourni un clip vidéo des flammes d’une boucle de cheminée de vacances, le programme a renvoyé 24 variables.

Une question particulièrement intéressante était de savoir si l’ensemble de variables était unique à chaque système ou si un ensemble différent était produit à chaque redémarrage du programme. “Je me suis toujours demandé si nous rencontrerions jamais une race extraterrestre intelligente, auraient-ils découvert les mêmes lois de la physique que nous, ou pourraient-ils décrire l’univers d’une manière différente?” dit Lipson. “Peut-être que certains phénomènes semblent étrangement complexes parce que nous essayons de les comprendre en utilisant le mauvais ensemble de variables.”

Dans les expériences, le nombre de variables était le même à chaque redémarrage de l’IA, mais les variables spécifiques étaient différentes à chaque fois. Alors oui, il existe bel et bien des façons alternatives de décrire l’univers et il est très possible que nos choix ne soient pas parfaits.

Selon les chercheurs, ce type d’IA pourrait aider les scientifiques à découvrir des phénomènes complexes pour lesquels la compréhension théorique ne peut pas suivre le déluge de données – des domaines allant de la biologie à la cosmologie. “Bien que nous ayons utilisé des données vidéo dans ce travail, n’importe quel type de source de données peut être utilisé – des réseaux radar ou[{” attribute=””>DNA arrays, for example,” explained Kuang Huang PhD ’22, who coauthored the paper.

The work is part of Lipson and Fu Foundation Professor of Mathematics Qiang Du’s decades-long interest in creating algorithms that can distill data into scientific laws. Past software systems, such as Lipson and Michael Schmidt’s Eureqa software, could distill freeform physical laws from experimental data, but only if the variables were identified in advance. But what if the variables are yet unknown?


Hod Lipson explique comment le programme d’IA a pu découvrir de nouvelles variables physiques. Crédit : Hod Lipson/Columbia Engineering

Lipson, qui est également professeur d’innovation James et Sally Scapa, soutient que les scientifiques peuvent mal interpréter ou mal comprendre de nombreux phénomènes simplement parce qu’ils ne disposent pas d’un bon ensemble de variables pour décrire les phénomènes. “Pendant des milliers d’années, les gens connaissaient les objets en mouvement rapide ou lent, mais ce n’est que lorsque la notion de vitesse et d’accélération a été formellement quantifiée que Newton a pu découvrir sa célèbre loi du mouvement F = MA”, a noté Lipson. Les variables décrivant la température et la pression devaient être identifiées avant que les lois de la thermodynamique puissent être formalisées, et ainsi de suite pour tous les coins du monde scientifique. Les variables sont un précurseur de toute théorie. “Quelles autres lois manquons-nous simplement parce que nous n’avons pas les variables?” demanda Du, qui dirigeait les travaux.

L’article a également été co-écrit par Sunand Raghupathi et Ishaan Chandratreya, qui ont aidé à collecter les données pour les expériences. Depuis le 1er juillet 2022, Boyuan Chen est professeur adjoint à l’Université Duke. Le travail fait partie d’un joint[{” attribute=””>University of Washington, Columbia, and Harvard NSF AI institute for dynamical systems, aimed to accelerate scientific discovery using AI.

Reference: “Automated discovery of fundamental variables hidden in experimental data” by Boyuan Chen, Kuang Huang, Sunand Raghupathi, Ishaan Chandratreya, Qiang Du and Hod Lipson, 25 July 2022, Nature Computational Science.
DOI: 10.1038/s43588-022-00281-6

Leave a Reply

Your email address will not be published.