L'irraisonnable efficacité des mathématiques dans les sciences de la nature

Vous consultez

L’irraisonnable efficacité des mathématiques dans les sciences de la nature [1]

Traduit parFrançoise Balibar

« … il y a probablement là un secret qui reste à découvrir »

(C. S. Peirce)
1

C’est l’histoire de deux anciens camarades de classe qui discutent de leurs métiers. Le premier qui est statisticien travaille sur l’évolution des populations ; il montre à son camarade le tiré-à-part d’un article qu’il vient décrire et qui, comme il se doit, commence par une distribution de Gauss ; il lui explique la signification des divers symboles : celui-ci représente la population réelle, celui-là la population moyenne etc. L’autre a l’air sceptique et se demande si son copain n’est pas en train de le mener en bateau. « Mais comment tu sais que c’est ça ? » demande-t-il. « Et ce symbole, là, qu’est-ce que c’est ? » « Oh ça, répond le statisticien, c’est pi. » « C’est quoi pi ? » « Le rapport entre la circonférence d’un cercle et son rayon. » « Eh non, arrête ; là tu pousses ; tu ne vas pas me faire croire que la population a quelque chose à voir avec la circonférence d’un cercle. »

2

Tant de naïveté prête à sourire. Pourtant, je dois avouer que lorsqu’on m’a raconté cette histoire j’ai éprouvé un sentiment bizarre car assurément la réaction du camarade de classe du statisticien relève du simple bon sens. Ce sentiment de confusion s’est trouvé renforcé quand à quelque temps de là un étudiant [2][2] F. Werner, alors qu’il était étudiant à Princeton. m’a fait part de sa perplexité face au choix extrêmement sélectif que nous faisons des données sur lesquelles nous mettons nos théories à l’épreuve : « Qu’est-ce qui prouve, me dit-il, qu’il n’est pas possible de bâtir une théorie où l’attention serait focalisée sur ceux des phénomènes que nous avons éliminés, et dont seraient éliminés certains des phénomènes sur lesquels nous focalisons en ce moment notre attention ? Cette théorie qui ressemblerait fort peu à notre théorie actuelle, expliquerait pourtant un aussi grand nombre de phénomènes ». Rien ne prouve, en effet, qu’une telle théorie ne puisse exister.

3

Ces deux histoires illustrent les deux considérations que je voudrais développer ici. Première considération : les concepts mathématiques peuvent intervenir là où on ne les attend pas ; de plus, là où ils interviennent, ils permettent souvent, de façon tout aussi inattendue, de donner une description fidèle et précise des phénomènes. Deuxième considération : de ce fait, et compte tenu de ce que nous ne comprenons pas les raisons de leur utilité, nous ne pouvons pas savoir si une théorie formulée en termes de concepts mathématiques est la seule qui convienne. Nous sommes dans la position de quelqu’un à qui on aurait donné un trousseau de clefs avec mission d’ouvrir les unes après les autres toute une série de portes, et qui serait toujours tombé sur la bonne clef du premier coup (éventuellement au deuxième) ; il serait en droit de s’interroger sur le caractère univoque de la correspondance entre les clefs et les portes.

4

Rien, ou presque rien, de ce que je vais exposer ici n’est véritablement nouveau ; la plupart des chercheurs ont dû, sous une forme ou sous une autre, à un moment ou à un autre, réfléchir aux questions que je me propose d’examiner sous divers éclairages. Je développerai deux points. Premièrement : l’énorme utilité dont font preuve les mathématiques dans les sciences de la nature ne s’explique pas de façon rationnelle, et reste donc de l’ordre du mystère. Deuxièmement : cette troublante utilité des concepts mathématiques oblige à se poser la question de l’unicité des théories physiques. Pour établir le premier point (les mathématiques jouent en physique un rôle d’une importance irraisonnable), il ne sera pas inutile de répondre en quelques mots aux deux questions : « Qu’est-ce que les mathématiques ? » et « Qu’est-ce que la physique ? » ; j’examinerai ensuite comment les mathématiques s’introduisent dans les théories physiques, et pour finir, pourquoi le succès rencontré par les mathématiques dans le rôle qui est le leur en physique nous paraît si étonnant. Je serai plus rapide sur le deuxième point (l’unicité des théories de la physique) ; répondre comme il convient à cette question nécessiterait d’y consacrer un travail théorique et expérimental approfondi qui n’a pas encore été entrepris.

Qu’est-ce que les mathématiques ?

5

Quelqu’un a dit un jour que la philosophie était l’usage impropre d’une terminologie qui a été inventée précisément à cette intention [3][3] Cette définition se trouve dans W. Dubislav, Die Philosophie.... Dans la même veine, je dirais que les mathématiques c’est la science des opérations délicates effectuées sur des concepts et des règles qui ont été inventés précisément à cette intention. Dans les deux cas, l’accent est mis sur l’invention de concepts. Les mathématiques cesseraient vite de produire des théorèmes intéressants si l’on exigeait que ces derniers soient formulés en termes de concepts figurant déjà dans les axiomes. De plus, alors qu’il ne fait pas de doute que les concepts des mathématiques élémentaires, et singulièrement ceux de la géométrie élémentaire, ont été inventés pour décrire des entités directement suggérées par le monde réel, on ne peut pas en dire autant des concepts moins élémentaires, tout particulièrement de ceux qui jouent un rôle si important en physique. Les règles qui régissent les opérations portant sur des couples de nombres ont clairement été conçues de manière à produire le même résultat que les opérations portant sur des fractions, enseignées à l’école sans qu’il soit fait référence à des « couples de nombres ». Les règles qui régissent les opérations portant sur des suites, c’est-à-dire sur des nombres irrationnels, appartiennent à cette même catégorie de règles qui ont été construites de manière à reproduire les règles régissant les opérations portant sur les grandeurs plus familières. La plupart des concepts mathématiques non élémentaires, les nombres complexes, les algèbres, les opérateurs linéaires, les ensembles de Borel – on pourrait prolonger la liste à l’infini – ont été conçus de façon à ce que les mathématiciens puissent exercer leur ingéniosité et satisfaire leur sens de la beauté formelle. De fait, en définissant leurs concepts, en parfaite connaissance du potentiel d’intérêt et d’ingéniosité que recèle leur application, les mathématiciens font déjà la preuve de leur ingéniosité. La profondeur de pensée qui entre dans la fabrication des concepts mathématiques explique par la suite que leur utilisation requière tant d’habileté. Un grand mathématicien est quelqu’un qui exploite à fond et, pour ainsi dire, de façon impitoyable le domaine de ce qui est permis, frôlant en permanence ce qui ne l’est pas. Qu’une telle témérité ne l’entraîne pas dans un labyrinthe de contradictions relève du miracle ; on a du mal à imaginer que notre capacité de raisonnement ait pu atteindre, par le seul processus darwinien de la sélection naturelle, le degré de perfection qui semble être le sien. Mais tel n’est pas notre sujet, aujourd’hui. Le point essentiel, dont il faudra se souvenir par la suite, est que le mathématicien ne peut formuler qu’un très petit nombre de théorèmes intéressants s’il ne définit pas de nouveaux concepts, transcendant ceux déjà contenus dans les axiomes ; et que ces concepts au delà de ceux déjà contenus dans les axiomes sont définis dans l’intention explicite de permettre des opérations logiques ingénieuses, esthétiquement satisfaisantes, à la fois en elles-mêmes et par la généralité et la simplicité de leurs résultats [4][4] M. Polanyi écrit à ce sujet : « Toutes ces difficultés....

6

Les nombres complexes constituent un parfait exemple de ce qui vient d’être dit. Rien dans notre expérience ne suggère qu’il faille introduire de telles quantités. Or, un mathématicien à qui l’on demanderait pourquoi il s’intéresse aux nombres complexes ne manquerait pas d’évoquer, sur un ton passablement indigné, les nombreux théorèmes de la théorie des équations, les développements en série, les fonctions analytiques etc., – autant d’exploits impensables sans l’introduction des nombres complexes, accomplissement du génie mathématique, auquel il n’est pas prêt de renoncer à accorder de l’intérêt [5][5] On pourra lire à ce propos les remarques irritées de....

Qu’est-ce que la physique ?

7

Ce qui intéresse le physicien, c’est la découverte des lois de la nature inanimée. Énoncé qui, pour être compris, nécessite que le concept de « lois de la nature » soit analysé.

8

Le monde qui nous entoure est d’une complexité déroutante dont n’émerge qu’une seule évidence : nous ne pouvons pas prédire le futur. La sagesse populaire dit que « le pire n’est jamais sûr » ; la sagesse populaire a raison : le futur ne peut pas être prédit [6][6] [NdT] : À cet endroit, Wigner fait référence à une.... Comme l’a fait remarquer Schrödinger [7][7] E. Schrödinger, Über Indeterminismus in der Physik,..., c’est un miracle qu’en dépit de la complexité déroutante du monde, il ait été possible de mettre à jour l’existence de certaines régularités dans les événements. Parmi ces régularités, il faut citer celle découverte par Galilée : deux pierres lâchées au même instant d’une même hauteur atteignent le sol au même instant. Les lois de la nature traitent de ce type de régularités. La régularité découverte par Galilée est le prototype d’une vaste classe de régularités. Elle est étonnante pour trois raisons.

9

Tout d’abord, il est surprenant que cette régularité soit vraie non seulement à Pise et à l’époque de Galilée, mais également partout à la surface de la Terre, qu’elle ait toujours été vraie et doive toujours l’être. Cette propriété est ce qu’on appelle une propriété d’invariance et j’ai déjà eu l’occasion d’expliquer, il y a quelque temps, que sans l’existence de principes d’invariance du type de ceux qu’implique la généralisation des observations de Galilée énoncée dans la phrase précédente, la physique ne serait pas possible.

10

La deuxième raison d’étonnement tient à ce que la régularité observée par Galilée est indépendante d’un nombre considérable de conditions dont on aurait pu imaginer qu’elles puissent affecter sa validité. Elle vaut qu’il pleuve ou qu’il vente, que l’expérience soit réalisée dans une pièce ou du haut de la tour de Pise, que la personne qui lâche les pierres soit un homme ou une femme. Elle vaut même si les deux pierres sont lâchées, simultanément et de la même hauteur, mais par deux personnes différentes. On n’en finirait pas d’énumérer toutes les conditions qui, pour ce qui est de la validité de la régularité découverte par Galilée, sont sans aucune incidence. Il fut un temps où le mot « invariance [8][8] E. P. Wigner, « Invariance in physical theory », Proc.... » était utilisé, en physique, pour désigner le fait que certaines circonstances, dont on pense qu’elles auraient pu jouer un rôle dans la constitution du phénomène observé, se révèlent être sans incidence. Ce type d’ « invariance » n’est pas de même nature que l’invariance évoquée plus haut en ceci qu’on ne peut pas lui donner la forme d’un principe général. De fait, explorer les conditions qui ont un effet, ou n’ont pas d’effet, sur un phénomène relève de l’exploration expérimentale préalable à toute investigation ; l’habileté et l’ingéniosité d’un expérimentateur se marque à la façon qu’il a de repérer les phénomènes qui ne dépendent que d’un nombre restreint de conditions relativement réalisables et reproductibles [9][9] À ce sujet, on peut se reporter à l’essai graphique.... Dans le cas qui nous intéresse ici, c’est en restreignant ses observations à des corps relativement lourds que Galilée s’est montré habile expérimentateur. Je le dis et le répète : s’il n’existait pas de phénomènes qui ne dépendent que d’un nombre limité de conditions sur lesquelles il est possible d’agir, la physique serait impossible.

11

L’étonnement ressenti par Galilée lorsqu’il fit sa découverte ne porte pas sur les deux caractéristiques que je viens d’analyser qui, bien que philosophiquement intéressantes, ne font pas apparaître une loi de la nature spécifique. La loi de la nature, véritable raison d’étonnement pour Galilée, est contenue dans l’énoncé selon lequel la longueur de temps nécessaire à un objet lourd pour tomber d’une hauteur donnée est indépendante de la taille de l’objet, de sa forme et du matériau dont il est fait. Ce qui dans le contexte de la seconde « loi » de Newton s’énonce ainsi : la force de gravitation qui agit sur le corps tout au long de sa chute est proportionnelle à sa masse mais indépendante de sa taille, de sa forme et du matériau dont il est fait. Je me suis attardé sur cet exemple afin de souligner que l’existence de « lois de la nature » n’a rien de naturel et surtout qu’il n’est pas évident que l’homme soit en mesure de découvrir [10][10] Voir E. Schrödinger, dans What is Life ?, Cambridge,... ces lois. J’ai déjà eu l’occasion, il y a quelque temps, d’attirer l’attention sur la disposition en strates superposées des « lois de la nature » : chaque strate contient des lois qui sont plus générales et plus englobantes que celles appartenant à la strate qui la précède ; la découverte d’une nouvelle strate correspond à un approfondissement de notre exploration de la structure de l’univers [11][11] E. P. Wigner, « The limits of science », Proc. Amer..... Ce qu’il importe de comprendre, pour ce qui nous concerne ici, c’est que toutes les « lois de la nature », même si l’on tient compte de leurs conséquences les plus lointaines, ne contiennent qu’une part infime de notre connaissance du monde. Les lois de la nature sont des énoncés conditionnels autorisant la prédiction de certains événements futurs sur la base de notre connaissance du présent. Or, pour ce qui est de la prédiction des événements futurs, certains aspects de l’état présent du monde – pratiquement, la plupart des déterminations de l’état présent du monde – n’ont aucun intérêt, ne « comptent pas » car ils sont sans incidence, au sens développé plus haut (deuxième raison d’étonnement face à la régularité découverte par Galilée [12][12] Inutile de dire que l’énoncé donné ici n’épuise pas...).

12

Sur l’état présent du monde – par exemple, l’existence de la Terre sur laquelle nous vivons et sur laquelle ont été réalisées les expériences de Galilée, l’existence du Soleil et de façon générale de tout notre environnement –, les lois de la nature sont muettes. En conséquence, les lois de la nature ne peuvent servir à prédire des événements futurs que dans certaines conditions exceptionnelles : quand sont connues toutes les déterminations de l’état présent du monde « qui comptent ». À rapprocher de ce qui est l’accomplissement le plus spectaculaire de la physique, à savoir la construction de machines dont on puisse prévoir le comportement : dans ces machines, est créée de toutes pièces une situation où toutes les coordonnées « qui comptent » sont connues, si bien que le comportement de la machine est prévisible. Les radars et les réacteurs nucléaires [13][13] [NdT] : Bel exemple de « wishful thinking ». Ce texte... sont des exemples de ce type de machines.

13

Les lois de la nature sont donc des énoncés conditionnels qui n’interviennent que dans une très faible partie de notre connaissance du monde. Prenons le cas de la mécanique classique, le plus célèbre prototype de théorie physique ; elle donne les dérivées secondes des coordonnées de position de tous les corps, connaissant les positions, etc., de ces corps. Elle ne donne aucune information sur l’existence de ces corps, ni sur leurs positions ou leurs vitesses à l’instant présent. Pour être précis, il faut signaler que l’on s’est aperçu il y a environ trente ans que les énoncés conditionnels eux-mêmes ne peuvent être parfaitement précis : les énoncés conditionnels sont des lois de probabilité qui permettent seulement de parier de façon intelligente sur les propriétés futures du monde inanimé, connaissant l’état présent. Ces lois ne permettent pas de produire des énoncés catégoriques, même pas des énoncés catégoriques conditionnés à la connaissance de l’état présent du monde. La nature probabiliste des « lois de la nature » intervient également dans le fonctionnement des machines, comme on peut le vérifier, au moins dans le cas des réacteurs nucléaires quand on les fait fonctionner à faible puissance. Néanmoins, les limitations supplémentaires apportées aux lois de la nature par leur caractère probabiliste [14][14] Voir E. Schrödinger, op. cit. ne joueront aucun rôle dans la discussion qui va suivre.

Le rôle des mathématiques en physique

14

Après ces rappels sur l’essence des mathématiques et de la physique, nous pouvons aborder en meilleure connaissance de cause la question du rôle que jouent les mathématiques dans les théories physiques.

15

Naturellement, les mathématiques sont quotidiennement utilisées par les physiciens, pour évaluer les résultats des lois de la nature, appliquer leurs énoncés conditionnels dans des conditions particulières, imposées par la situation ou présentant, pour une raison ou une autre, un certain intérêt. Pour cela, il faut que les lois de la nature soient déjà exprimées en langage mathématique. Mais l’essentiel du rôle joué par les mathématiques en physique ne se situe pas là, dans l’évaluation des conséquences de théories déjà établies, où les mathématiques, ou plutôt les mathématiques appliquées, sont un simple outil et n’ont pas la maîtrise du jeu.

16

De fait, à côté de ce rôle d’application, les mathématiques ont en physique un rôle plus souverain, déjà implicite dans l’affirmation selon laquelle le rôle d’application des mathématiques suppose que les lois de la nature aient été au préalable formulées en langage mathématique. Que les lois de la nature soient écrites en langage mathématique, c’est ce qui a été affirmé il y a plus de trois cents ans [15][15] Cet énoncé est généralement attribué à Galilée. et qui est aujourd’hui plus vrai que jamais. A titre d’exemple de l’importance qu’ont les concepts mathématiques dans la formulation des lois de la physique, considérons les axiomes de la mécanique quantique tels qu’ils ont été énoncés, explicitement par le mathématicien J. von Neumann, implicitement par le physicien Paul Dirac [16][16] J. von Neumann, Mathematische Grundlagen der Quantenmechanik,.... La mécanique quantique repose sur deux concepts fondamentaux : les états et les observables. Les états sont des vecteurs d’un espace de Hilbert ; les observables sont des opérateurs auto-adjoints agissant sur ces vecteurs. Les valeurs propres de ces opérateurs sont les valeurs que peuvent donner les observations… mais il vaut mieux que je m’en tienne là, sinon je risque de dresser la liste de tous les concepts mathématiques de la théorie des opérateurs linéaires.

17

Il est vrai que la physique fait un choix parmi tous les concepts mathématiques : la formulation des lois de la nature ne requiert qu’une fraction d’entre eux. Il est vrai aussi que les concepts choisis ne l’ont pas été de façon arbitraire à partir de la liste de tous les concepts mathématiques ; dans la plupart des cas, pour ne pas dire dans tous les cas, les concepts ont été développés indépendamment par les physiciens, puis identifiés comme ayant déjà été inventés par les mathématiciens. En revanche, il n’est pas vrai que, comme on l’affirme si souvent, il ne peut pas en être autrement, au motif dit-on que les mathématiques utilisent les concepts les plus simples, et que ceux-ci figurent nécessairement dans n’importe quel formalisme. Ce n’est pas vrai car, comme nous l’avons vu plus haut, les concepts des mathématiques ne sont pas choisis pour leur simplicité conceptuelle – même les suites de couples de nombres [17][17] [NdT] : Cet exemple est ici choisi par Wigner parce... sont loin d’être conceptuellement simples –, mais pour les possibilités de manipulations et de raisonnements qu’ils offrent. Souvenons-nous que l’espace de Hilbert de la mécanique quantique est construit sur le corps des nombres complexes (il est muni d’un produit scalaire hermitien). Pour un esprit non averti, les nombres complexes n’ont rien de naturel ni de simple ; leur utilisation en mécanique quantique ne peut avoir été suggérée par des observations physiques. On n’a pas non plus affaire à un de ces trucs de calcul auxquels ont recours les mathématiques appliquées. De fait, l’utilisation des nombres complexes est de l’ordre de la nécessité, elle est imposée par la formulation des lois de la mécanique quantique. (On commence aujourd’hui à comprendre que, non seulement les nombres complexes, mais également les fonctions analytiques sont amenés à jouer un rôle décisif dans la formulation de la théorie quantique. Je pense à la théorie des relations de dispersion, en plein essor en ce moment)

18

Il est difficile de résister à l’impression que nous avons affaire à un miracle, de même nature que le miracle qu’est la possibilité pour le cerveau humain d’enchaîner des milliers de raisonnements sans s’emmêler dans les contradictions, ou que ces deux autres miracles que sont l’existence de lois de la nature jointe au fait que le cerveau humain est capable de les deviner. La remarque faite par Einstein, observant que les seules théories que nous soyons prêts à accepter sont celles qui sont belles, est ce qui, à ma connaissance, s’approche le plus d’une explication du rôle joué par les mathématiques en physique ; resterait d’ailleurs à établir que la beauté est une qualité dont jouissent les concepts mathématiques. Mais la remarque d’Einstein, si elle peut, au mieux, expliquer les propriétés des théories que nous sommes prêts à accepter, ne fait aucune référence à la précision intrinsèque des théories physiques. C’est ce point qu’il nous faut maintenant examiner.

Faut-il vraiment s’étonner du succès de la théorie physique ?

19

Pour expliquer que les physiciens ont recours aux mathématiques pour formuler leurs « lois de la nature », on peut, évidemment, invoquer une forme d’irresponsabilité dont se rendraient coupables les physiciens qui, tombant sur une relation entre deux quantités qui ressemble à une relation déjà bien étudiée en mathématiques, concluraient immédiatement à l’identité des deux relations, tout simplement parce qu’ils n’en connaissent pas d’autres. Je n’ai pas l’intention de réfuter cette accusation d’irresponsabilité, dont je n’exclue pas qu’elle puisse être justifiée. Je ferai simplement remarquer que la formulation mathématique d’expériences souvent grossières à laquelle se livrent les physiciens conduit, dans bon nombre de cas, à une description étonnamment précise d’une classe entière de phénomènes. D’où je conclus que le langage mathématique s’impose pour d’autres raisons que le simple fait que nous n’en connaissons pas d’autre ; il est, de façon vraiment réelle, le langage correct, celui qui convient. Considérons quelques exemples.

20

Le premier est l’exemple souvent cité du mouvement des planètes. Les lois de la chute des corps ont été relativement bien établies au terme d’une série d’expériences réalisées essentiellement en Italie. Ces expériences ne pouvaient évidemment pas être précises au sens où nous l’entendons aujourd’hui, en raison d’une part de l’effet de la résistance de l’air et d’autre part de l’impossibilité où l’on était à l’époque de mesurer les petits intervalles de temps. Néanmoins les scientifiques italiens ont, grâce à ces expériences, acquis une certaine familiarité avec le déplacement des objets dans l’atmosphère. Newton ensuite a mis en relation la loi de la chute des corps avec le mouvement de la Lune, en remarquant que la parabole décrite sur terre par une pierre que l’on lance et la portion de cercle décrite dans le ciel par la Lune sont deux cas particuliers d’un même objet mathématique, la section d’un cône par un plan (une conique), et en postulant à partir d’une unique et approximative coïncidence numérique, la loi universelle de la gravitation. D’un point de vue philosophique, la loi de la gravitation, telle qu’elle a été formulée par Newton, avait tout pour déplaire (à ses contemporains autant qu’à lui-même). D’un point de vue empirique, elle reposait sur un nombre limité d’observations éparses. Quant au langage mathématique dans lequel cette loi était formulée, il faisait intervenir le concept de dérivée seconde ; quiconque a jamais essayé de tracer le cercle osculateur d’une courbe en un de ses points peut témoigner de ce que le concept de dérivée seconde n’a rien d’immédiat. Or cette loi de la gravitation que Newton avait établie sans enthousiasme et qu’il n’avait pu vérifier qu’avec une précision de 4% s’est révélée être exacte avec une précision d’un dix millième de pourcent ; longtemps elle a été associée à l’idée de précision absolue et il a fallu attendre 1959 pour que les physiciens osent enfin fixer des limites à sa précision [18][18] Voir, par exemple, R. H. Dicke, Am. Sci., 25, 1959. Nul doute que la loi de Newton, par ailleurs si souvent évoquée, doive figurer en tête du palmarès des lois qui, formulées en termes que les mathématiciens qualifient de simples, se sont révélées d’une précision au-delà de toute attente. Je m’arrête un instant pour résumer sur ce premier exemple la thèse que je défends ici : tout d’abord, cette loi, qui fait intervenir une dérivée seconde, ne paraît simple qu’à des mathématiciens, elle ne l’est certainement pas pour le sens commun ni même aux yeux d’un étudiant de première année ; ensuite, cette loi est conditionnelle, d’application très limitée ; elle n’explique rien qui concerne la Terre, laquelle dans l’expérience de Galilée attire les pierres, pas plus qu’elle n’explique la forme circulaire de l’orbite de la Lune etc. L’explication de ces conditions initiales est laissée aux bons soins des géologues et des astronomes, qui ont bien du mal.

21

Mon deuxième exemple est celui de la mécanique quantique ordinaire, élémentaire. Tout a commencé avec la remarque que fit Max Born constatant que certaines des règles de calcul établies auparavant par Heisenberg étaient identiques à celles du calcul matriciel, connues des mathématiciens depuis un certain temps. Born, Jordan et Heisenberg proposèrent alors de remplacer par des matrices les variables de position et de quantité de mouvement dans les équations de la mécanique classique. L’application des règles de cette mécanique des matrices à la résolution de quelques problèmes, extrêmement simplifiés et idéalisés, donna des résultats satisfaisants ; rien ne prouvait à l’époque que la validité de cette mécanique des matrices résisterait à son application à des situations plus réalistes ; il s’agissait de savoir « si la mécanique ici proposée est déjà correcte dans ses grandes lignes [19][19] M. Born, P. Jordan, « Zur Quantenmechanik », Zeit.... ». De fait, la première application de la mécanique des matrices à un cas réel, celui de l’atome d’hydrogène, fut l’œuvre quelques mois plus tard de Pauli ; les résultats étaient en accord avec les données expérimentales. Ce résultat, pour satisfaisant qu’il fût, pouvait néanmoins être expliqué par le fait que les règles de calcul établies par Heisenberg l’avaient été en raisonnant sur des problèmes découlant de l’ancienne théorie de l’atome d’hydrogène. Le miracle se produisit finalement le jour où la mécanique des matrices (ou plutôt une théorie qui lui était mathématiquement équivalente) fut appliquée à des problèmes n’ayant rien à voir avec les règles de calcul de Heisenberg. Plus précisément, les règles énoncées par Heisenberg présupposaient que les équations classiques du mouvement admettent des solutions présentant certaines propriétés de périodicité ; c’est précisément ce qui ne peut être présupposé dans le cas des équations du mouvement des deux électrons de l’atome d’hélium, ou d’un plus grand nombre d’électrons dans un atome plus lourd – en sorte que les règles de Heisenberg ne peuvent leur être appliquées. Le résultat du calcul de l’énergie la plus basse de l’atome d’hélium, effectué par Kinoshita à Cornell et par Bazley au National Bureau of Standards de Washington, s’avéra conforme aux données expérimentales avec une précision de un dix-millionième, égale à celle des résultats expérimentaux. Les équations avaient indiscutablement fourni, dans ce cas, « quelque chose » qui n’y avait pas été mis au départ.

22

Cette conclusion vaut également pour les caractéristiques qualitatives des « spectres complexes » (les spectres des atomes plus lourds). Je voudrais à ce sujet mentionner une conversation que j’ai eue avec Jordan au moment où ces caractéristiques qualitatives furent établies : tout écart entre les résultats déduits de la théorie de la mécanique quantique et les résultats empiriques aurait été, disait-il, notre dernière chance de pouvoir modifier le cadre théorique de la mécanique des matrices. Autrement dit, Jordan considérait que, si les conséquences de la théorie de l’atome d’hélium n’avaient pas, contre toute attente, été en accord avec l’expérience, nous nous serions trouvés, momentanément du moins, sans cadre théorique. Le formalisme mathématique (que développaient à l’époque [20][20] [NdT] : 1929. Kellner et Hilleraas) était si clair qu’il ne pouvait être modifié ; si le miracle de l’atome d’hélium, dont je viens de parler, ne s’était pas produit il en serait résulté une véritable crise. Crise que la physique aurait certainement réussi à surmonter. Il est vrai, d’autre part, que la physique telle que nous la connaissons aujourd’hui a été rendue possible par à une succession de miracles du même type que celui de l’atome d’hélium. Ce miracle – peut-être le plus étonnant de tous ceux dont a été jalonnée l’histoire de la mécanique quantique élémentaire – n’est certainement pas le dernier. En réalité, je pense que le nombre de ces miracles n’est pas limité ; la mécanique quantique a connu tant d’épisodes presqu’aussi glorieux que celui de l’atome d’hélium que nous avons acquis la conviction qu’elle peut être considérée comme « correcte ».

23

Mon dernier exemple est celui de l’électrodynamique quantique, plus exactement la théorie du décalage de Lamb (Lamb shift[21][21] [NdT] : Tel est le nom qui désigne ce phénomène, même...). Alors que la théorie de la gravitation de Newton était encore en lien évident avec l’expérience, dans la formulation de la mécanique matricielle, l’expérience n’était en rapport avec l’expérience que dans la forme raffinée et sublimée qu’avait donnée Heisenberg à l’énoncé de ses règles. La théorie quantique du Lamb shift, conçue par Bethe et établie par Schwinger, est une théorie purement mathématique où l’expérience n’intervient directement que par la démonstration de l’existence d’un effet mesurable. L’accord entre théorie et expérience est de un pour mille, voire mieux.

24

Ces trois exemples – que l’on pourrait multiplier à l’envi – illustrent à quel point la formulation mathématique des lois de la nature en termes de concepts choisis pour la possibilité qu’ils offrent d’être manipulés, est à la fois juste et précise, les « lois de la nature » étant quant à elles d’une précision fantastique mais d’une application extrêmement restreinte. Je propose d’appeler « loi empirique de l’épistémologie », l’observation qu’illustrent ces exemples. Cette loi empirique est tout aussi indispensable que les lois d’invariance à l’existence des théories physiques. Sans les lois d’invariance, les lois de la physique n’auraient aucun fondement factuel ; si la loi empirique de l’épistémologie n’était pas correcte, nous manquerions d’incitation et de garanties, conditions émotionnelles dont dépend le succès de l’entreprise d’exploration des « lois de la physique ».

25

Le Professeur R. G. Sachs, avec qui je discutais il y a quelque temps de la loi empirique de l’épistémologie, y a vu « l’article de foi du physicien théoricien » ; c’est exactement ce dont il s’agit. À ceci près que ce qu’il appelle un article de foi peut être étayé par des exemples réels, bien plus nombreux que les trois exemples évoqués plus haut.

L’unicité des théories de la physique

26

La nature empirique de la précédente observation ne fait, à mon avis, aucun doute. Il ne s’agit certainement pas d’une « nécessité de la pensée », dans la mesure où – faut-il le rappeler ? – cette observation ne concerne qu’une part infime de notre connaissance du monde inanimé. Il serait absurde de penser que l’existence d’expressions mathématiquement simples pour la dérivée seconde de la position est une chose qui va de soi, alors même qu’il n’existe rien d’analogue pour la position elle-même et pour la vitesse. Il est donc étonnant de constater avec quelle facilité le merveilleux cadeau que contient la loi empirique de l’épistémologie a été considéré comme allant de soi. La capacité du cerveau humain à fabriquer un réseau de mille conclusions sans pour autant perdre la tête, capacité que j’ai déjà évoquée, est un autre de ces cadeaux merveilleux.

27

L’ennui avec les lois empiriques est qu’on ne sait pas jusqu’où elles s’appliquent. Nous avons vu que les événements du monde autour de nous présentent des régularités qui peuvent être formulées en termes de concepts mathématiques avec une troublante précision. À côté, il existe certains aspects du monde dont nous ne pensons pas qu’ils présentent une régularité précise. C’est ce que nous appelons des conditions initiales. Se pose alors la question de savoir si les diverses régularités, autrement dit, les différentes lois de la nature dont certaines sont encore à découvrir, finiront pas fusionner en une entité unique cohérente, ou même approcheront de façon asymptotique cet état fusionnel. Mais il se pourrait aussi qu’il reste toujours quelques lois de la nature n’ayant rien à voir entre elles ; c’est le cas aujourd’hui, par exemple, des lois de l’hérédité et des lois de la physique. Il se pourrait même que des lois de la nature entrent en conflit les unes avec les autres au niveau de leurs conséquences mais que chacune d’entre elles soit suffisamment convaincante dans son domaine pour que nous souhaitions n’en abandonner aucune ; il se peut que nous nous résignions à cet état de choses, mais il se peut aussi que nous cessions de trouver le moindre intérêt au règlement des conflits entre théories. Il se peut que nous ne nous intéressions plus à « la vérité ultime », c’est-à-dire une grande image obtenue par la fusion en une seule entité cohérente des images plus petites, formées à partir des divers aspects de la nature.

28

Il peut être utile d’illustrer par des exemples ces différentes possibilités. Nous disposons aujourd’hui en physique de deux théories, remarquablement puissantes et intéressantes : la théorie des phénomènes quantiques et la théorie de la relativité. Ces deux théories s’enracinent dans deux groupes de phénomène s’excluant l’un l’autre. La théorie de la relativité s’applique aux corps macroscopiques, les étoiles par exemple. L’événement primitif en théorie de la relativité est la coïncidence, c’est-à-dire en dernière analyse la collision ; un événement définit un point de l’espace-temps, ou du moins définirait un point si les particules entrant en collision étaient infiniment petites. La théorie quantique, quant à elle, s’enracine dans le monde microscopique ; de son point de vue, l’événement que constitue la coïncidence ou la collision, même s’il porte sur des particules sans extension spatiale, n’est pas un événement primitif et n’est certainement pas isolé dans l’espace-temps. Les deux théories font intervenir des concepts mathématiques différents : un espace de Riemann à quatre dimensions et un espace de Hilbert de dimension infinie, respectivement. À ce jour, les deux théories n’ont pu être unifiées, c’est-à-dire qu’il n’existe pas de formulation mathématique dont les deux théories soient des approximations. Tous les physiciens pensent que l’union des deux théories est intrinsèquement possible et que nous finirons par la découvrir. Mais on peut aussi imaginer qu’il ne soit pas possible d’unifier ces deux théories. Cet exemple illustre les deux possibilités mentionnées plus haut, unification ou conflit, l’une et l’autre concevables.

29

Afin d’obtenir une indication concernant laquelle de ces possibilités risque, au bout du compte, de l’emporter, nous pouvons faire comme si nous étions plus ignorants que nous sommes et nous placer à un niveau de connaissance inférieur à celui qui est le nôtre en réalité. Si à ce niveau inférieur de compréhension, il est possible de trouver une fusion des deux théories, on est en droit d’espérer qu’une telle fusion puisse se produire également au niveau qui est le nôtre en réalité. En revanche, si au niveau inférieur les deux théories paraissent irréconciliables, la possibilité que la contradiction persiste à un niveau de compréhension plus élevé ne peut être exclue. Le niveau de connaissance et d’ingéniosité est une variable continue et il est peu probable qu’une variation relativement petite de cette variable continue fasse basculer l’image du monde qui nous est accessible d’un état unique cohérent à un état divisé, incohérent [22][22] C’est après avoir longuement hésité que l’auteur s’est....

30

À cet égard, le fait que certaines théories que nous savons être fausses donnent des résultats étonnamment précis ne joue pas en faveur d’une image unifiée. Si nous en savions moins, le groupe de phénomènes que ces théories « fausses » expliquent serait une « preuve » suffisante de leur validité. Cependant si ces théories sont considérées comme « fausses », c’est parce qu’elles sont, en dernière analyse, incompatibles avec des représentations plus englobantes ; en sorte qu’arrivera un moment où, ayant découvert un suffisamment grand nombre de ces théories fausses, il apparaîtra qu’elles se contredisent entre elles. De même, il n’est pas impossible que des théories que nous considérons comme « prouvées » par un nombre d’accords numériques que nous estimons suffisant, soient fausses parce qu’elles sont en contradiction avec une théorie plus englobante située hors d’atteinte, au delà de nos capacités de découverte. Si ce raisonnement est juste, il faut s’attendre à ce que au fur et à mesure que nos théories se multiplient et couvrent des domaines de plus en plus vastes de phénomènes, on atteigne un seuil au delà duquel elles se contredisent entre elles. Tel est le cauchemar du théoricien – à mille lieux de l’article de foi évoqué plus haut.

31

Voici quelques exemples de théories « fausses » qui donnent des phénomènes une description d’une précision que l’on doit, compte tenu de cette « fausseté », considérer comme alarmante. Avec un peu de bonne volonté, il est possible d’écarter certains de ces exemples. C’est le cas de la première théorie de l’atome, le « modèle de Bohr », qui n’a jamais été considérée comme une théorie générale ; cela vaut aussi pour les épicycles de Ptolémée ; le point de vue actuel donne une description précise de tous les phénomènes que décrivent ces théories plus primitives. Tel n’est pas le cas, en revanche, de ce que l’on appelle « la théorie de l’électron libre [23][23] [NdT] : Il s’agit de ce qui est communément appelé..., » qui donne une description merveilleusement précise de la plupart des propriétés des métaux, des semiconducteurs et des isolants – pour ne pas dire de toutes leurs propriétés. Cette théorie explique en particulier un phénomène qui n’a jamais été bien compris par la « vraie théorie », à savoir le fait que les isolants ont une résistance électrique qui peut être jusqu’à 1026 fois supérieure à celle des métaux. De fait, aucun résultat expérimental ne prouve que cette résistance ne puisse pas être infinie dans les conditions où la théorie de l’électron libre prédit une résistance infinie. Néanmoins les physiciens sont tous convaincus que la théorie de l’électron libre n’est qu’une grossière approximation qui, pour ce qui est de la description de tous les phénomènes relatifs aux solides, doit être remplacée par une vision plus précise des choses.

32

Considérée du point de vue qui est développé ici, la situation présentée par la théorie de l’électron libre – pour irritante qu’elle soit –, ne laisse pas présager l’émergence de contradictions insurmontables. La théorie de l’électron libre incite simplement à ne pas prendre l’accord entre théorie et expérience pour une preuve de validité de la théorie. Il n’y a là rien dont nous n’ayons déjà l’habitude.

33

La situation serait beaucoup plus embarrassante si nous pouvions un jour bâtir une théorie des phénomènes de la conscience ou une théorie de la biologie qui ait la même force de conviction et la même cohérence interne que les théories actuelles du monde inanimé. Il se pourrait, en ce qui concerne la biologie, que les lois de Mendel et les travaux sur les gènes qui en sont dérivés soient l’amorce d’une telle théorie. De plus, il n’est pas impossible qu’on trouve un jour un argument abstrait établissant que cette théorie est en contradiction avec les principes de la physique. Imaginons en outre que cet argument soit d’une nature telle qu’il soit impossible de résoudre expérimentalement cette contradiction au profit de l’une ou l’autre des deux parties. Si tel était un jour le cas, nul doute que la confiance que nous autres les physiciens plaçons dans nos théories en serait durement ébranlée, tout comme notre croyance dans la réalité des concepts que nous formons. La recherche de ce que j’ai appelé « la vérité ultime » n’aurait plus de raison d’être. Il faut bien voir que si une telle situation est envisageable, c’est fondamentalement parce que nous ne savons pas pourquoi nos théories marchent si bien. La précision qu’elles autorisent n’est nullement la preuve de leur vérité et de leur cohérence. Pour être honnête, le présent auteur est persuadé que l’on sera confronté à une situation de ce type si un jour les lois de l’hérédité et celles de la physique entrent en conflit.

34

Je terminerai par une considération plus encourageante. Le miracle de l’adéquation du langage des mathématiques à la formulation des lois de la physique est un cadeau merveilleux que nous ne comprenons pas et ne méritons pas. Nous devons nous en réjouir et espérer que ce miracle continuera à se produire et à étendre son effet à d’autres branches du savoir – pour le meilleur et pour le pire, pour notre plaisir mais aussi peut-être pour notre confusion.

Notes

[1]

L’auteur souhaite dire ici tout ce qu’il doit au Dr M. Polanyi qui, il y a déjà longtemps, a profondément influencé ses réflexions sur les questions d’épistémologie, ainsi qu’à V. Bargmann qui, par ses critiques amicales, a contribué à clarifier cet écrit. La gratitude de l’auteur va également à A. Shimony qui a revu le présent article et a attiré mon attention sur les écrits de C. S. Peirce.

Conférence « Richard Courant » en Sciences mathématiques ; prononcée le 11 mai 1959 à New York University par Eugene P. Wigner, de Princeton ; publiée dans Communications on Pure and Applied Mathematics, 13, 1960, p. 1-14. [NdT] : On trouve sur Internet plusieurs versions plus ou moins « arrangées » de cette conférence.

[2]

F. Werner, alors qu’il était étudiant à Princeton.

[3]

Cette définition se trouve dans W. Dubislav, Die Philosophie der Mathematik in der Gegenwart, Berlin, Junker und Dunnhaupt Verlag, 1932, p. 1.

[4]

M. Polanyi écrit à ce sujet : « Toutes ces difficultés viennent de ce que nous refusons de voir que les mathématiques ne peuvent pas être définies sans tenir compte de ce qui en est le trait essentiel, à savoir qu’elles sont intéressantes », Personal Knowledge, Chicago, University of Chicago Press, 1958, p.188.

[5]

On pourra lire à ce propos les remarques irritées de Hilbert parlant de l’intuitionnisme qui, dit-il, « cherche à détruire et défigurer les mathématiques », Gesammelte Werke, Berlin, Springer, 1935, p.188.

[6]

[NdT] : À cet endroit, Wigner fait référence à une blague (a joke) selon laquelle il faut être optimiste pour penser que le futur est incertain. Ne trouvant pas de strict équivalent français de cette blague (anglo-saxonne ? hongroise ? allemande ? Yddish ?), j’ai eu recours à un « à-peu-près » (« le pire n’est jamais sûr », qui n’est pas une blague mais un aphorisme) ; la conclusion n’est en rien changée : le futur ne peut pas être prédit.

[7]

E. Schrödinger, Über Indeterminismus in der Physik, J. A. Barth, Leipzig, 1932 ; voir également W. Dubislav, Naturphilosophie, Junker und Dünnhaupt, Berlin, 1933, ch. IV.

[8]

E. P. Wigner, « Invariance in physical theory », Proc. Amer. Philos. Soc.,vol 93, 1949, p. 521-526.

[9]

À ce sujet, on peut se reporter à l’essai graphique de M. Deutsch paru dans Daedalus 87, 86, 1958. A. Shimony a attiré mon attention sur un passage figurant dans C. S. Pierce, Essays in Philosophy of Science, New York, The Liberal Arts Press, 1957, p. 237. [NdT] : Une traduction en français des œuvres complètes de Peirce est en cours sous la direction de C. Tiercelin, aux Éditions du Cerf (2002- ).

[10]

Voir E. Schrödinger, dans What is Life ?, Cambridge, Cambridge University Press, 1945, p. 31.

[11]

E. P. Wigner, « The limits of science », Proc. Amer. Philos. Soc.,vol 94, 1950, p. 422 ; voir également H. Margenau, The Nature of Physical Reality, McGraw-Hill, New York, 1950, ch. 8.

[12]

Inutile de dire que l’énoncé donné ici n’épuise pas le contenu des observations de Galilée relatives aux lois de la chute des corps.

[13]

[NdT] : Bel exemple de « wishful thinking ». Ce texte a été écrit en 1960. L’accident de Three Mile Island s’est produit en 1979.

[14]

Voir E. Schrödinger, op. cit.

[15]

Cet énoncé est généralement attribué à Galilée.

[16]

J. von Neumann, Mathematische Grundlagen der Quantenmechanik, Springer, Berlin, 1932 ; trad. fr. Fondements mathématiques de la mécanique quantique, Éditions Jacques Gabay, 1992. P. A. M. Dirac, Quantum Mechanics, [1930], 3ème éd., Clarendon Press, Oxford, 1947 ; Les principes de la mécanique quantique, d’après la 4ème éd., 1958, Lausanne, Presses polytechniques et universitaires romandes, 2009.

[17]

[NdT] : Cet exemple est ici choisi par Wigner parce que ces couples permettent de construire les nombres complexes sur le corps desquels est construit l’espace de Hilbert de la mécanique quantique, mentionné par Wigner au paragraphe précédent et auquel il va revenir dans la phrase suivante.

[18]

Voir, par exemple, R. H. Dicke, Am. Sci., 25, 1959.

[19]

M. Born, P. Jordan, « Zur Quantenmechanik », Zeit. f. Phys., n° 34, 1925, p. 858-888. M. Born, W, Heisenberg, P. Jordan, « Zur Quantenmechanik », II, Zeit. f. Phys., n° 35, 1926, p. 557-615 (la phrase citée se trouve p. 558).

[20]

[NdT] : 1929.

[21]

[NdT] : Tel est le nom qui désigne ce phénomène, même en français.

[22]

C’est après avoir longuement hésité que l’auteur s’est résolu à publier ce passage. Il est persuadé de l’intérêt qu’il y a, dans toute discussion épistémologique, à abandonner l’idéalisation qui consiste à penser que l’intelligence humaine occupe un niveau singulier sur une échelle absolue. Il peut même être utile, dans certains cas, d’envisager ce qui peut être réalisé au niveau intellectuel propre à une autre espèce. L’auteur a parfaitement conscience que l’exposé de son raisonnement, tel qu’il apparaît dans le texte, est à la fois trop bref et insuffisamment soumis à la critique, pour prétendre à une quelconque fiabilité.

[23]

[NdT] : Il s’agit de ce qui est communément appelé le « modèle des électrons libres » — « théorie » grossière du comportement des électrons dans un métal, où l’on ignore délibérément le fait que ces électrons, eux-mêmes détachés des atomes du métal, évoluent dans un champ électrique (créé par ces mêmes atomes du métal déshabillés d’un ou plus de leurs électrons) et ne sont donc certainement pas « libres » de se déplacer n’importe comment à l’intérieur du métal. Les prévisions de cette « théorie » sont, de façon inattendue, en très bon accord avec les résultats expérimentaux ; les théories plus réalistes et plus sophistiquées développées par la suite ne sont pas toujours plus exactes.

Plan de l'article

  1. Qu’est-ce que les mathématiques ?
  2. Qu’est-ce que la physique ?
  3. Le rôle des mathématiques en physique
  4. Faut-il vraiment s’étonner du succès de la théorie physique ?
  5. L’unicité des théories de la physique