Jalons pour une Histoire de la Philosophie de la nature III-2 Les philosophies de la nature à l’ère scientifique moderne. Gödel et Einstein

Les grandes révolutions scientifiques du xxe siècle

« Les découvertes de la physique moderne ont profondément modifié des notions telles que celles d’espace, de temps, de matière, d’objet, de cause et d’effet [1] ».

À la fin du siècle dernier, l’espoir naquit d’unifier dans la formule englobante d’un dé­terminisme universel et le macrocosme régi par les lois de la physique newtonienne et le microcosme régi par les lois de la nouvelle physique-chimie, émergeant notamment des théories de Maxwell. On s’attendait à ce que, tôt ou tard, la biologie puis la sociologie et la psychologie soient intégrés dans l’idéal positiviste. « Dans un siècle, l’humanité saura à peu près ce qu’elle peut savoir sur son passé », écrit Ernest Renan en 1890 [2]. Que pensez-vous de cette prophétie, hommes de la dernière décennie de ce siècle ?

Cependant, alors que le xixe siècle s’achevait en croyant avoir définitivement établi l’avènement des sciences de la nature sur des fondements matérialistes, le début de notre siècle va être ébranlé par différentes découvertes qui vont mettre à bas tout ce projet. On peut même parler de déconfiture de l’idéal scientiste.

A) Les limitations internes des formalismes

Ce principe est surtout connu en mathématique. Il a été établi par le mathématicien Kurt Gödel, en 1931. Il énonce que tout système formel contient des propositions indéci­dables, c’est-à-dire des énoncés dont on ne peut démontrer la vérité que dans une méta-théorie. Plus précisément, « toutes les formulations axiomatiques consistantes de la théo­rie des nombres incluent des propositions indécidables [3] ». Autrement dit, il y a un ex­cédent d’intuition que la raison ne peut formaliser.

De même, il nous faut sortir de la conception naïve d’une science univoque, dont la si­gnification est fixée. Même en mathématiques, une théorie définie par une axiomatique précise assez riche peut donner l’existence à une infinité de modèles, autrement dit re­cevoir une infinité d’interprétations cohérentes avec le formalisme mais non équivalentes d’un point de vue logique. C’est le sens du théorème de Löwenstein-Skolem que de le montrer [4]. De même la mécanique quantique est susceptible de recevoir plusieurs in­terprétations ontologiques toutes adéquates avec la formalisation de la théorie. La conséquence en est que non seulement le discours scientifique est mesuré, limité, mais que les sciences actuelles ouvrent à une herméneutique, à une interprétation, à une re­cherche de sens, donc à une philosophie.

1) Notions historiques

Le théorème de Kurt Gödel (1906-1978) [5] est la réponse à la question de la crise des fondements des mathématiques apparue avec les paradoxes de Bertrand Russell et George Cantor, à la fin du siècle dernier. Pour le comprendre, faisons un très bref histo­rique.

En 1873, le logicien allemand Gottlob Frege construit le premier système de logique formelle entièrement symbolique.

2) Quelques notions d’axiomatique [6]

Il faudrait dire un mot sur la différence entre logique formelle et mathématique. D’abord sur la distinction entre logique formelle et logique traditionnelle.

a) Langue-objet et métalangue

« Un système formel se présente comme un instrument d’expression d’une forme parti­culière : il permet de former des expressions et de les enchaîner selon des règles pré­cises. Il constitue une langue d’un type spécial, une langue formalisée. D’autre part, il peut être considéré comme un objet dont on étudie les propriétés : on doit se servir dans ce but d’une autre langue dans laquelle on dispose de termes pour désigner les élé­ments du système. C’est ainsi qu’on est amené à distinguer langue-objet et métalangue ».

Prenons comme exemple de langue-objet la langue objet (c’est l’exemple le plus im­médiat). « Nous pouvons décrire les caractères de ce système au moyen de la langue française, à la condition d’y ajouter certaines expressions pour désigner les éléments du système. Ainsi nous pouvons utiliser le symbole Va pour désigner une variable du sys­tème, le symbole Pr pour désigner une proposition du système. […] Le système d’ex­pressions ainsi constitué est une métalangue [7] ».

b) Que veut dire indécidable ?

« Une dérivation est une suite de propositions dont chacune est soit un axiome soit la proposition conséquente d’un schéma de dérivation dont la (ou les) proposition(s) anté­cédente(s) figure(nt) avant elle dans la suite ».

D’où « une proposition est dérivable s’il existe une dérivation dont elle constitue la pro­position finale ». Par exemple un théorème.

« Lorsqu’un système comporte un opérateur de négation, on peut définir ce qu’on ap­pelle une proposition réfutable dans ce système : c’est une proposition dont la négation (proposition formée en faisant précéder la proposition donnée par l’opérateur de néga­tion) est dérivable dans le système.

« Une proposition est dite indécidable dans un système (qui comporte un opérateur de négation) si elle n’est ni dérivable ni réfutable dans ce système [8] ».

3) énoncé [9]

Tout système formel contient des propositions indécidables. « Le théorème de Gödel établit l’existence, pour une classe de formalismes répondant à des conditions très géné­rales, de propositions indécidables [10] ».

Pour le dire autrement, « le théorème de Gödel nous a appris que dès le moment où une théorie possède une certaine puissance (et c’est déjà le cas pour l’arithmétique ordi­naire), sa non-contradiction ne peut être établie que dans une méta-théorie où intervien­nent des procédés de démonstration plus puissants que ceux de la théorie elle-même, ce qui entraîne en particulier pour conséquence que la métamathématique ne peut se contenter d’un cadre strictement finitiste [11] ».

Rappelons d’un mot, sans intervention d’une quelconque technicité symbolique, le cœur de ce que nous enseignent le théorème de Gödel et, de manière plus générale, les théorèmes limitatifs : tout système formel contient des propositions indéci­dables. Précisément : « Toutes les formulations axiomatiques consistantes de la théorie des nombres incluent des propositions indécidables [12] ». Plus précisément, ils énoncent qu’on peut établir la non-contradiction d’une théorie qui possède une certaine puissance (et tel est le cas pour l’arithmétique ordinaire), seulement dans une méta-théorie où sont employés des procédés de démonstration plus puissants que ceux de la théorie elle-même.

Cette seconde formulation apporte une précision trop oubliée et que nous exploiterons ci-dessous : ce théorème n’a de sens que dans le cadre d’une théorie assez large pour formaliser l’arithmétique ; or, celle-ci est doué d’une réelle puissance, puisqu’il contient un infini dénombrable (celui de la suite des nombres). Cela signifie donc qu’il est pos­sible de construire des systèmes auxquels le raisonnement de Gödel et consorts ne s’appliquent pas et qui sont dénués de propositions indécidables. Mais il s’agit ou bien de systèmes peu puissants ou bien de systèmes dont les termes sont polysémiques

Ces conditions générales se ramènent aux deux suivantes : « le formalisme doit être non-contradictoire, et doit être assez large pour que l’arithmétique y soit formalisable ». Ce dernier point est décisif. En effet, l’arithmétique contient un infini dénombrable (celui de la suite des nombres). Donc, parler de théorème de Gödel est au moins implicitement, faire intervenir l’infini.

4) Exposé non formalisé

Pour un exposé absolument informel, renvoyons à l’ouvrage de Hofstadter cité ci-des­sus.

« La proposition indécidable de Gödel est bâtie sur le modèle du paradoxe du menteur [13] ». La signification philosophique de la démonstration de Gödel est centrée sur le pa­radoxe du menteur. [14] Mais cette proposition « est cependant construite de telle façon qu’elle ne conduit à aucune contradiction ».

C’est aussi ce qui fait la difficulté de ce classique et insoluble paradoxe d’autoréférence : « Le barbier rase tous ceux qui ne se rasent pas eux-mêmes. Qui rase le barbier ? » Plus généralement, le célèbre théorème de limitation interne des systèmes formels énoncé par Kurt Gödel me semble notamment s’interpréter en termes de différence puissance-acte et la confirmer [15].

Logicien et philosophe des sciences Ernest Nagel a donné une présentation simple, élémentaire de la démonstration du théorème de Gödel [16]. Le sens de la démonstra­tion est centrée sur l’analogie avec le dilemme du menteur. Ce théorème est un sorte d’anneau de Mœbius de la métamathématique.

L’une des propositions indécidables du système qui est suffisante pour exprimer l’arithmétique est justement celle qui affirme qu’il n’est pas contradictoire. Aussi, doit-on conclure que « la formalisation ne peut se clore sur elle-même [17] ».

Donnons-en un exemple. Soit le syllogisme sophistique suivant : Omnes apostoli Dei sunt duodecim. Petrus et Jacobus sunt apostoli. Ergo Petrus et Jacobus sunt duodecim

Comment démasquer le sophisme ? Certes, le moyen terme est utilisé dans deux sens différents. Mais lesquels ? « L’erreur consiste dans le fait de confondre le sens «collectif» avec le sens «distributif» ; par sa signification collective, dans la première prémisse, omnes forme la classe des douze apôtres ; mais comme il n’est pas distributif, il n’attribue pas le prédicat sunt duodecim à chaque membre de la classe ou à deux de ses membres [18] ».

Or, explique Dimitriu : « Dans la proposition «considérons la série de tous les nombres ordinaux possibles, inclusivement o le plus grand», le mot tous n’a plus le sens collectif ou catégorématique ; […] la proposition ne peut avoir qu’un sens distributif ou syncatégo­rématique, c’est-à-dire : «considérons chacun de tous les nombres ordinaux possibles». On ne forme pas une série nouvelle [19] ».

À noter que ce théorème présente une double version, syntaxique et sémantique.

5) Validité du théorème

La démonstration de Gödel, maintes fois confirmée, n’a rien d’accidentel. Sa limitation est liée à la structure et à la nature même du langage formel ; elle présente donc un ca­ractère de nécessité. C’est précisément le recours à la méthode formelle qui entraîne les restrictions décrites dans les théorèmes de limitation. Chaïtin a réalisé une démonstra­tion informatique du théorème de Gödel, et surtout a montré qu’il existait des énoncés in­décidables jusque dans les énoncés les plus élémentaires de la théorie des nombres. Il s’agit en l’occurrence d’une équation diophantienne exponentielle. [20]

Comme l’a montré Jacques Vauthier dans son exposé (p. XXX), la démonstration d’une limitation interne des formalismes a sonné comme un coup de tonnerre dans un ciel se­rein. En fait, si la secousse tellurique (noétique) a la mathématique et la logique formelle comme épicentre, l’onde de choc a fait le tour de quasiment toutes les connaissance humaines. En tout cas, chacune a tenté de réfléchir à sa manière sur ces théorèmes, sans toujours éviter la tentation d’une sorte de « pan-gödelisme ». Il est bien évidemment illusoire de passer en revue tous les penseurs qui ont réfléchi sur ce théorème. Du moins peut-on explorer un certain nombre de domaines où il trouve application, résonance, voire confirmation et prolongement, ce qui ne signifie pas que toutes les applications de ce théorème soient philosophiquement recevables. Nous n’hésiterons pas à épingler quelques critiques chemin faisant.

6) Confirmations et élargissements de l’indécidabilité

J’en donnerai deux : la conjecture de Syracuse et l’équation de Chaitin.

a) La conjecture de Syracuse. Le fait

La conjecture de Syracuse [21] doit son nom à l’Université de Syracuse aux États-Unis, où elle fut longtemps étudié. On lui préfère aujourd’hui le nom de « problème 3 x + 1. Elle se présente sous une forme on ne peut plus simple, compréhensible par tout élève en classe de seconde. Distinguons la règle de la conjecture et du résultat. Soit la règle du jeu. Prenez un nombre entier, n. S’il est pair, vous le divisez par 2 ; s’il est impair, vous le multipliez par 3 et vous ajoutez 1. Vous recommencez cette opération avec le résultat obtenu jusqu’à ce que vous tombiez sur 1. D’ailleurs, arrivé à 1, le cycle est indéfiniment le même : 1-4-2-1.

Par exemple, partons de 10. Les étapes sont les suivantes : 5 (10/2) ; 16 (3 x 5 + 1) ; 8 (16/2) ; 4 (8/2) ; 2 (4/2) ; 1.

La conjecture de Syracuse énonce : la démarche aboutit toujours à 1. On peut même préciser : en un nombre fini d’étapes. Mais l’essentiel est que l’on ne peut pas atterrir ailleurs qu’en 1.

Or, il se trouve que cette affirmation est péremptoire, injustifiée. De fait, tous les calculs qui ont été opérés jusqu’à maintenant, ont tous abouti à 1 ; et on a essayé tous les nombres jusqu’à… 3,2 x 1016. Mais on ne sait pas si, en droit, certains nombres se­raient tels qu’ils n’atterriraient jamais en 1. Voilà pourquoi l’on parle de conjecture ou d’hypothèse.

Cette conjecture dont l’origine, confuse, remonte vers 1950, fut l’objet de l’attention d’un nombre considérable de mathématiciens et même d’universités, des moins connus aux plus prestigieux. Or, même les plus géniaux butent ! « Pendant un mois, dit S. Kakutani qui fit circuler le problème, tout le monde à l’université de Yale travailla dessus, sans ré­sultat. Un phénomène semblable se produisit à l’Université de Chicago. Cette énigme, pensaient certains, avait été avancée par le kgb pour ralentir la recherche mathématique aux États-Unis ».

b) Le sens de la conjecture

Le grand mathématicien Paul Erdös répondait que, malgré la déconcertante simplicité de l’énoncé, « les mathématiques ne sont pas encore prêtes pour aborder de telles ques­tions ». Faut-il dire, avec Jean-Paul Delahaye, que, contrairement à la croyance fréquente, le savoir ne progresse pas toujours du plus simple au plus compliqué, mais, qu’après s’être affronté aux problèmes les plus difficiles, il butte parfois sur des questions d’une désarmante simplicité ?

Cependant, qu’est-ce qui pourrait donner naissance à ces difficultés agaçantes appa­remment aussi élémentaires qu’insolubles , à ces « murailles invisibles » ? Au plan sub­jectif, elles sont humiliantes ; au plan objectif, elles témoignent peut-être d’une indéci­dabilité : la conjecture de Syracuse est-elle indémontrable par les méthodes tradition­nelles des mathématiques ? Par exemple, la très puissante théorie des ensembles se­rait-elle impuissante à démontrer la vérité ou la fausseté de cette proposition ? Cela si­gnifierait qu’il existe un entier qui n’atterrit pas à 1, mais dont on ne peut montrer qu’il n’atterrira jamais à 1. De même, la suite des décimales du nombre p est parfaitement déterminée par des règles arithmétiques fixées ; pourtant, elle se conforme à un modèle probabiliste clairement identifié, de sorte que p constitue le modèle du tirage équitable des chiffres ; enfin, il est impossible de démontrer qu’à un niveau donné, les chiffres ne suivront pas une loi d’apparition prévisible.

Or, il y a des raisons de considérer comme sérieuse cette interprétation en termes d’in­décidabilité. J. Conway a considéré des généralisations de la conjecture de Syracuse ; or, il a montré comment définir une conjecture, du type « tout n atterrit à 1 », pour qu’elle soit indécidable dans la théorie des ensembles. Plus généralement, la méthode de Conway permet de construire un problème ressemblant à la conjecture de Syracuse qui soit indécidable (eu égard à une théorie donnée). Mais il n’y a que ressemblance, ce qui ne signifie pas que la dite conjecture soit indécidable.

Il est en tout cas hautement signifiant que le mystère vienne de l’intérieur borner, limiter les disciplines les plus hautement formalisées. Plus encore, cette limitation interne concernerait non pas les extrêmes, le terme de processus d’une abstraction exception­nelle, mais les commencements eux-mêmes, comme pour signifier que ceux-ci ne sont pas totalement construits mais comportent une part irréductible de donné. En effet, la conjecture se fonde sur la distinction pair-impair. Or, cette distinction est première au sein des nombres entiers dits naturels, elle concerne le fondement, le donné de base. L’indécidabilité touchant le fondement montrerait alors qu’une intuitivité excède toute formalisation.

c) L’équation de Chaitin

L’une des grandes objections adressée au théorème de Gödel est son caractère mar­ginal, monstrueux, au sens propre du terme. Si l’existence d’indémontrables a profon­dément troublé certains mathématiciens éminents comme John von Neumann, la majo­rité d’entre eux estiment que ces singularités sont exceptionnelles et n’entrent pas dans le cadre des mathématiques courantes, notamment pas dans l’arithmétique. Le théorème de limitation est donc valide, réel, mais il est négligeable. Rappelons-nous qu’il en fut de même pour les courbes continues sans dérivées : le physicien les pensait inexistantes ; or, aujourd’hui, les courbes fractales ont envahi la nature.

N’en est-il pas de même en mathématique ? Un mathématicien important, Gregory Chaitin, vient de montrer que les énoncés indécidables « sont très fréquents, parfois très simples et que certains d’entre eux résident au cœur de l’arithmétique la plus élémen­taire [22] ». Pour cela, Chaitin se fonde sur les techniques de la théorie algorithmique de l’information. Chaitin a écrit une équation à jamais insoluble, transférant en arithmétique élémentaire les énoncés d’incomplétude. Il s’agit d’une équation diophantienne [23] ex­ponentielle possédant dix-sept mille variables (près de 200 pages de listing) ! Elle est paramètrée par un nombre k. Cette équation code un nombre dont le contenu en infor­mation est incompressible ou aléatoire : on appelle incompressible un nombre dont l’écriture en base deux n’est absolument par redondante : les k premiers bits ont un contenu en information approximativement égal à k ; on le dit aussi aléatoire, car la meilleur méthode pour l’obtenir est le simple tirage au sort.

Or, ce nombre incompressible est le nombre oméga v : Chaitin a lui-même découvert ce nombre en 1974 ; ce nombre aléatoire v est égal à la probabilité qu’une machine de Turing (ordinateur abstrait de mémoire potentiellement infinie pouvant simuler le fonc­tionnement de n’importe quel ordinateur) universelle s’arrête au bout d’un nombre fini d’étapes quand elle a été alimentée par un programme tiré au sort. Ce nombre peut être défini avec précision, mais ne peut pas être calculé explicitement. Il est, au sens propre, incalculable : aucun programme ne peut calculer ses n premiers bits en un temps Tn dé­terminé, quelle que soit la valeur de n. Il est algorithmiquement aléatoire. En regard, le nombre p est transcendant mais calculable : de nombreux algorithmes permettent d’en calculer effectivement les n premiers bits en un temps déterminé.

Concluons. Les indécidables de Gödel ne sont donc pas aussi pathologiques qu’on veut le dire. « Bien que le théorème initial de Gödel semble ne concerner que des énon­cés mathématique inhabituels n’ayant, selon toute vraisemblance, que peu d’intérêt pra­tique, la théorie algorithmique de l’information a montré que l’incomplétude et le hasard sont naturels et omniprésents [24] ». Autrement dit, les insuccès des mathématiciens n’est peut-être pas d’abord liée à la difficulté intrinsèque des problèmes qu’ils tentent de ré­soudre, mais à l’incomplétude de leurs axiomes, donc aux limites internes de la formali­sation mathématique. « En vérité, continue Chaitin, le fait que de nombreux problèmes mathématiques soient restés non résolus pendant des centaines, voire des milliers d’an­nées conforte mon intuition [25] ».

Il faut donc corriger une impression fréquente : qu’un énoncé soit compréhensible, soit sémantiquement signifiant, ne veut pas dire qu’il en existe une démonstration pertinente. Même un énoncé élémentaire, compréhensible par un enfant de douze ans, peut s’avé­rer indécidable. Par exemple, l’énoncé : « tout nombre pair est la somme de deux nombres premiers », dit conjecture de Goldbach, est peut-être indécidable. De même la question de savoir s’il existe des nombres parfaits (c’est-à-dire tels que la somme de ses diviseurs soit égale au nombre lui-même) impairs n’a toujours pas été tranchée. De même l’hypothèse de Riemann. La formalisation est débordée par l’intuition, même pour les nombres entiers. Autrement dit, « notre intuition des nombres entiers est loin d’être claire et précise comme nous le pensons tous. Elle est même irrémédiablement limitée, incomplète et vague [26] ».

B) Les métamorphoses de la physique fondamentale au début du xxe siècle. Les théories de la relativité

o) Introduction les deux grandes théories physiques

Deux théories physiques profondément novatrices ont paru au début du siècle. La première « décrit la force de gravité et la structure à grande échelle de l’univers, c’est-à-dire la structure à des échelles allant de quelques kilomètres à un million de milliards de milliards de kilomètres (1 suivi de 24 zéros), dimension de l’univers observable. La mé­canique quantique, elle, s’intéresse à des phénomènes à échelle extrêmement réduite, comme le millionième de millionième du centimètre [27] ». Autrement dit, si la relativité s’intéresse à l’infiniment grand, la mécanique quantique s’intéresse à l’infiniment grand.

Ce qui est vrai de l’espace vaut aussi pour le temps : la théorie d’Einstein porte sur l’in­finiment long : le célèbre Big Bang qui mesure l’échelle cosmique, s’est produit entre 10 et 15 milliards d’années ; la théorie quantique, à rebours, porte sur l’infiniment court : certaines particules ont une durée de vie aux alentours de 10-30 seconde.

En revanche et paradoxalement, ces deux disciplines sont explorées par des appareils de mesure qui sont tous deux aussi monstrueux l’un que l’autre. Plus encore, la méca­nique quantique fait appel à des appareils d’autant plus frappés de gigantisme que la particule traquée est plus minuscule : à partir du principe de Heisenberg, un simple cal­cul permet en effet de comprendre que la détectabilité est inversement proportionnelle à la taille.

« Si l’on osait un classement des grands physiciens du XXe siècle dans l’esprit de leurs collègues, on obtiendrait à peu près : Einstein, Bohr, Heisenberg, Dirac (et Pauli) ». En effet, et tel est le critère implicite utilisé par Salam, qu’explicite la conférence de Heisenberg donnée dans l’ouvrage, « il est parfaitement clair, après la conférence de Heisenberg, que Bohr était content lorsqu’il parvenait à convaincre Einstein de la jus­tesse de ses idées. Heisenberg éprouvait les mêmes sentiments à l’égard de Bohr que Bohr à l’égard d’Einstein, tandis que Dirac considérait Heisenberg comme son maître. (Je sais que Pauli avait la même vénération pour Dirac) [28] ».

Albert Einstein (1879-1955) [29] est à ce point génial qu’il est à lui seul l’inventeur d’une des deux théories physiques les plus révolutionnaires et les plus fécondes du xxe siècle et de tous les temps : la théorie ou plutôt les théories de la relativité restreinte (1905) et de la relativité générale (1916).

1) Limites de la théorie classique. L’expérience de Michelson et Morlay

La Mécanique classique estime que tous les systèmes galiléens sont équivalents. Et la transformation de Galilée qui permet de passer d’un système d’inertie à un autre, conduit à une loi d’addition de vitesses. Mais cette loi vaut aussi pour la vitesse de la lumière. C’est donc que celle-ci est différente dans deux systèmes galiléens.

Il faut prendre ici le temps d’expliquer la fameuse expérience mise au point par Michelson et Morley.

a) Technique

 

« L’appareil est horizontal. Un faisceau lumineux horizontal, de couleur pure (monochromatique), issu de S tombe à 45° sur une glace G dont la première face, légè­rement argentée, est semi-transparente. Une partie du faisceau se réfléchit vers un miroir M (premier rayon) tandis que l’autre partie traverse la glace et aboutit à un second miroir N (second rayon). Après réflexion normale sur M et N, les deux rayons reviennent vers G. Le premier rayon traverse en partie et parvient à la lunette L ; le second rayon pénètre dans la glace G, se réfléchit partiellement au dos de al face semi-argentée et arrive aussi à L. Ainsi des rayons issus de S se mélangent à nouveau dans la lunette L après les parcours respectifs SOMOL et SONOL ; ils y produiront des franges d’interférence alter­nativement brillantes et obscures.

« Les miroirs M et N appartiennent à deux bras rectangulaires de l’appareil. On règle la position de ces miroirs de manière à obtenir dans la lunette L la frange centrale d’interfé­rences à la croisée des fils du réticule. Ce réglage nous assure que les deux rayons ont mis le même temps pour effectuer leur parcours. L’examen des franges est un moyen extraordinairement précis de ses rendre compte que la durée de propagation aller et re­tour sur le bras OM est strictement égale à celle de l’autre trajet sur le bras perpendicu­laire ON. On réalise ainsi minutieusement l’égalité des temps.

« Si la vitesse de la lumière n’est pas la même dans les deux directions, les deux bras OM et ON sont inégaux : si la lumière va plus vite dans la direction OM par exemple (en moyenne sur le double trajet) le bras OM sera plus long que ON.

« Faisons alors tourner de 90° l’appareil, qui est mobile sur une plate-forme, de manière que le bras le plus court vienne prendre la place du plus long, tandis que le plus long prend la direction où la vitesse est la plus faible. L’égalité des temps va disparaître et l’on devra voir la frange centrale quitter la croisée des fils du réticule et se déplacer, entraî­nant tout le système de franges [30] ».

b) Résultats

Le résultat observé est le seul auquel on ne s’attendait pas : « L’inattendu, l’impossible arrive : aucun déplacement des franges ne fut perceptible. Les choses se passent comme si la Terre était immobile. En faisant tourner lentement l’appareil de 360° on a pu se convaincre que toutes les directions se valent : la vitesse de la lumière est exactement la même par rapport à l’appareil dans toutes les directions. À toutes les époques de l’an­née, le résultat est toujours resté les époques de l’année, le résultat est toujours resté négatif. La lumière possède en tous temps une propagation isotrope par rapport à l’ob­servateur. On eut beau perfectionner l’appareil, affirmer les réglages, changer de lati­tudes, opérer au sommet des montagnes, rien n’y fit : le résultat fut toujours zéro, aux im­perfections près de l’instrument ou de l’expérimentateur [31] ». Les techniques actuelles permettraient d’observer un vent d’éther un millième de fois inférieur à celui qui devrait exister.

On a répété la même expérience avec quantité de longueurs d’ondes, en haute altitude autant que sous la surface de la Terre, sur divers continents, à toutes les époques de l’année (notamment à six mois d’intervalle) et sur près de 80 ans. Les résultats sont d’un conservatisme absolu : le déplacement est nul. Autrement dit : il est impossible de détec­ter expérimentalement le moindre mouvement de la Terre par rapport à l’éther.

Or, l’expérience de Michelson et Morlay a montré que la vitesse de la lumière dans le vide est une constante c, isotrope et indépendante du mouvement de la source qui l’émet.

C’est donc qu’il y a une incompatibilité majeure entre la Mécanique classique, newto­nienne et l’expérience. Or, cette inadéquation traduit la limite de la théorie, son incompé­tence. Il est donc temps qu’entre en lice une autre théorie. Cela sera l’œuvre d’un homme unique, de la taille d’un Newton : Albert Einstein.

2) Théorie de la relativité restreinte

Je me contenterai d’exposer très succinctement quelques notions de la théorie de la relativité restreinte.

a) Énoncé des deux postulats

Énonçons les deux postulats qui sont à la base de la théorie einsteinienne exposée dans le mémoire de 1905 sur l’électrodynamique des corps en mouvement :

  1. Tous les systèmes galiléens (systèmes d’inertie) sont équivalents, qu’ils répondent aux lois de la mécanique ou de l’électromagnétique.
  2. La vitesse de la lumière dans le vide c est constante, quel que soit le système gali­léen et quel que soit le mouvement de la source.
b) Une conséquence sur l’espace-temps
1’) Le fait

Une conséquence spectaculaire de la théorie de la relativité restreinte est la contraction des longueurs et des corps en mouvement. Une autre concerne non plus l’espace mais le temps : la dilatation des durées. L’expérience confirme abondamment et spectaculai­rement. Par exemple, la durée de vie du muon, particule subatomique, est de l’ordre d’un millionième de seconde au repos. Or, issus des rayons cosmiques, ils acquièrent une vitesse proche de celle de la lumière ; on observe alors qu’ils peuvent arriver au sol en traversant toute l’atmosphère, soit plusieurs dizaines de kilomètres, avant d’être désinté­grés. Un calcul élémentaire montre alors que leur durée de vie est de l’ordre de quelques dix-millièmes de seconde. C’est donc que la durée de vie des muons s’est ral­longée, considérablement, grâce à la vitesse qu’ils ont acquises.

Autrement dit, plus un corps se meut vite, d’une vitesse proche de la célérité d’une ra­diation électromagnétique comme la lumière, plus les longueurs physiques se contrac­tent et les durées se dilatent (le sens passe plus longtemps).

2’) Le problème herméneutique

Comment interpréter ces phénomènes étonnants ? On peut se poser la question : ces variations de longueur (à savoir la contraction, la diminution) et de temps (à savoir la dila­tation, l’allongement) sont-elles réelles ? Sont-elles des propriétés intrinsèques ? Cette question a donné lieu à bien des méprises, d’ailleurs en sens contraires, ont eu lieu. Certains ont affirmé que le solide physique, le système changeait intrinsèquement, que, par exemple, en mouvement, il se raccourcissait : l’expérience ne montre-t-elle pas par exemple l’allongement de la vie des muons ? D’autres ont dit que, selon les propos d’Einstein lui-même, le mouvement n’affectait pas l’objet physique lui-même et donc que le raccourcissement observé était une illusion n’affectant que l’apparence. Pour y voir clair, il faut distinguer trois interprétations possibles :

3’) Interprétation maximaliste

Telle a été l’interprétation proposée par Fitzgerald et Lorenz pour rendre compte de l’expérience de Michelson et Morlay, ainsi que nous l’avons vu. Selon ces physiciens, la contraction des longueurs (ils ne parlent pas de la dilatation du temps) est un effet phy­sique, intrinsèque, non réciproque. C’était « une véritable modification physique due au mouvement par rapport à l’éther ».

4’) Interprétation minimaliste

Ne serait-il pas plus raisonnable de revenir à l’interprétation classique ? Selon l’inter­prétation classique, galiléenne, la longueur et le temps sont des absolus indépendants du mouvement du système de référence. Dès lors, le raccourcissement est une propriété illusoire.

5’) Interprétation équilibrée

Il faut tenir et que les changements sont réels (contre l’interprétation minimaliste) et qu’ils n’affectent que l’apparence, qu’ils ne sont pas des propriétés intrinsèques des choses (contre l’interprétation maximaliste). Cette distinction qui n’est pas factieuse re­pose sur l’analyse. « pour Einstein, il s’agit d’un effet apparent (mais non illusoire) pure­ment observationnel et réciproque, provoqué par le mouvement relatif [32] ». L’interprétation maximaliste, intrinsèque, refuse la réciprocité.

Autrement dit, dilatation et contraction sont réels en tant qu’il est impossible de s’affran­chir de la multiplicité des référentiels, que l’on ne mesure jamais qu’à partir d’un système de références, que l’observateur est toujours dans un cadre spatio-temporel donné ; mais elles n’affectent pas l’objet. Ces changements appartiennent donc bien à l’observa­tion du sujet connaissant, mais ne touchent pas la structure de l’objet connu.

Essayons, à la suite de Lévy-Leblond d’encore mieux le comprendre, tant cette consé­quence heurte notre bon sens spontané. « Il s’agit en fait tout simplement d’effets de pers­pective, ou plus précisément, de parallaxe, dans l’espace-temps, tout à fait analogues aux effets spatiaux usuels. Lorsque l’on désire mesurer la longueur d’un objet en le comparant à une règle graduée, il va de soi qu’on repère les extrémités de l’objet sur la règle de référence disposée parallèlement à al longueur que l’on veut mesurer. Si pour une raison quelconque ce parallélisme est impossible, l’obliquité de la règle par rapport à l’objet mesuré amènera la visée à repérer, par projection (perpendiculaire à sa direc­tion propre) sur la règle, une longueur apparente plus grande. Cette « ‘dilatation de la longueur’ est l’effet de parallaxe, dû à ce que le repérage se fait sur une règle de réfé­rence dot la direction spatiale diffère de celle de l’objet. Il n’en reste pas moins que l’ob­jet a bien une longueur intrinsèque qui s’obtient en disposant la règle parallèlement à sa direction propre ou, faute de mieux, en corrigeant la lecture par le facteur angulaire adé­quat [33] ».

Plus précisément encore, c’est le rôle des formules de transformation que de permettre de passer d’un référentiel à un autre (ce qui se traduit par un changement d’axes). Or, ici, c’est la transformation dite de Lorentz qu’Einstein utilise. Elle ne nous est pas familière, mais elle aboutit au même effet, à savoir qu’un objet de longueur Lo dans son propre ré­férentiel, se verra attribué, dans un autre référentiel, animé par un mouvement plus ra­pide, une autre longueur L, plus courte ; mais cette différence de longueur n’est qu’un effet de parallaxe, répétons-le. Il faudrait que les axes spatio-temporels coïncident avec ceux de la règle, pour être assuré de mesurer la longueur propre, intrinsèque de l’objet, longueur qui, répétons-le, comme propriété ontologique, intrinsèque, n’a jamais changé.

La dilatation des temps s’explique de manière analogue.

c) Autre conséquences sur la masse

Tout le monde connaît l’équation la plus célèbre de l’univers : E = mc2. Cette équation, très tôt découverte par Einstein, est une autre conséquence, aussi spectaculaire que fé­conde, de la théorie relativiste.

Quel en est la signification précise ? Il n’est pas rare que l’on interprète de manière er­ronée cette fameuse équivalence matière-énergie. Notamment, il est tentant de corréler la démonstration que fait Einstein de la croissance de la masse, en fonction de la vitesse du référentiel. En effet, le corps en repos a une masse inférieure au corps en mouvement ; or, le mouvement développe de l’énergie cinétique ; c’est donc que la masse est équi­valente à l’énergie.

Mais ce raisonnement ne prend pas garde que le terme masse présente deux sens dif­férents. En mécanique newtonienne et galiléenne, la notion de masse signifie deux choses : d’une part, la quantité intrinsèque de matière contenue dans l’objet physique ; d’autre part, une propriété, à savoir l’inertie de l’objet lorsqu’on cherche à modifier son état de mouvement. Dans le cadre de cette mécanique, ces deux quantités sont propor­tionnelles et, moyennant un choix convenable d’unités, sont identifiables.

Il n’en est plus de même dans le cadre de l’interprétation actuelle de la théorie de la relativité qui distingue le premier sens à qui elle réserve le terme de masse, et le second qu’elle appelle inertie. La masse est une propriété essentielle de l’objet, intrinsèque et invariante, c’est-à-dire indépendante du mouvement de l’objet. En revanche, l’inertie est variable, elle est proportionnelle à l’énergie ; or, celle-ci varie en fonction de la vitesse ; donc la masse inerte est elle-même variable, elle croît au fur et à mesure où la vitesse s’approche de la vitesse-limite.

Or, la formule E = mc2 s’entend de la masse au premier sens du terme, non de la masse inerte : elle identifie, au facteur c2 près, la masse à l’énergie. Ainsi, cette énergie est, comme la masse, une propriété invariante, indépendante du mouvement de l’objet. Ce qui signifie aussi que l’énergie totale d’un objet est la somme de cette énergie interne liée à la masse et de l’énergie cinétique, liée à la masse inerte ; donc l’énergie de la masse ou l’énergie interne est identique à l’énergie d’un système, d’un objet « au repos », d’énergie cinétique nulle.

3) Théorie de la relativité à la fin du xxe siècle

Sur le plan historique, on est passé d’une réflexion sur les phénomènes électromagné­tiques. Dans la systématisation de 1905, l’invariance isotropique de la vitesse de lumière et la forme des équations de Maxwell était des notions premières, des postulats, des­quelles on déduisait d’autres notions, comme la relativité, l’invariance. Mais, avec le re­cul, il apparaît que l’ordre logique et pédagogique est inverse de l’ordre historique : c’est l’invariance qui permet d’éclairer les autres notions. Par exemple, l’invariance de la vi­tesse de la lumière est aujourd’hui interprétée comme l’application de la loi de la relati­vité appliquée à la vitesse : celle-ci stipule que la vitesse d’un système est égale à la vi­tesse-limite qu’est c, lorsque la masse est nulle ; or, la masse du photon qui est la parti­cule lumineuse est nulle. Plus encore, on pourrait démontrer que le photon a une masse non nulle et donc que la lumière a une vitesse inférieure à c. Une telle constatation ruine­rait le premier postulat de la théorie de la relativité tel qu’il fut exprimé en 1905. En réa­lité, ce fait ne l’invaliderait en rien. Au contraire, la théorie servirait à réélaborer la théorie électromagnétique de Maxwell.

Précisons. Depuis 1905, Minkowski puis Weyl ont proposé une reformulation de la théorie de la relativité qui l’actualise géométriquement, qui corresponde aux récents ac­quis de la mathématique. Pour cela, ils ont fait appel à l’étude dans un certain espace de ses propriétés invariantes, grâce à la théorie des groupes de transformations. La phy­sique classique fait appel à la théorie de groupe euclidien (translations et rotations). La physique relativiste fait appel à une autre théorie de groupe, le groupe de Lorentz. Or, cette théorie met d’abord l’accent sur les propriétés invariantes qui expriment les aspects intrinsèques et absolus de l’espace étudié. Par exemple, en géométrie euclidienne, ordi­naire, c’est la distance entre deux points qui est un invariant euclidien ; en physique ein­steinienne, c’est un complexe qui fait intervenir le temps et l’espace et celui-ci devient un invariant.

Cette modification apparaît abstraite de prime abord. Mais le bénéfice est considérable. Il organise de l’intérieur la théorie, la faisant passer du plus universel au moins universel, hiérarchisant les notions : on a vu plus haut que l’invariance de c trouvait ainsi son expli­cation et se trouvait mieux fondée. Avec le recul, « on sait maintenant construire l’édifice conceptuel de la relativité à partir d’hypothèses très générales ne concernant que la structure de l’espace-temps, sans suppositions particulières concernant tel phénomène physique, propagation de la lumière ou autre [34] ». De plus, l’utilisation d’invariants et de covariants facilite et clarifie considérablement les calculs : à l’économie d’écriture est joint, comme toujours, un affinement conceptuel.

Sur le plan épistémologique, d’une part, la théorie d’Einstein est toujours validée. Elle n’est pas réfutée : aucune contradiction interne n’a été révélée en son sein ; aucune ex­périence ne l’a contredite. « Pourtant, depuis 1905, l’échelle des dimensions spatiales explorées par la physique s’est étendue d’un facteur de dix millions dans chaque sens – amplification bien supérieure à celle qui, à partir du monde newtonien, avait exigé la ré­volution einsteinienne [35] ».

D’autre part, sa fécondité est persistante. La théorie de la relativité restreinte régit tou­jours notre manière de comprendre la physique particulaire et les interactions fondamen­tales de haute énergie. C’est grâce à elle que l’on construit des accélérateurs de parti­cule.

La théorie de la relativité générale commande l’élaboration des modèles cosmolo­giques. Elle n’est pas démontrée directement. Il demeure Il faudrait établir l’existence de champs gravitationnels. Or, on ne peut les observer à l’échelle terrestre du fait de leur petitesse ; on doit les mesurer là où ils sont intenses, au sein des astres compacts comme les étoiles à neutrons. Une détection directe des ondes gravitationnelles attend toujours. Il demeure que des preuves indirectes s’accumulent. Par exemple, le ralentis­sement de la rotation de certains pulsars est une indication convaincante de l’émission de ces ondes [36]. Voilà pourquoi les systèmes de navigation satellitaires (gps) doivent les intégrer.

Il faudrait changer de noms, comme Einstein lui-même le reconnaissait dès 1920. La théorie de la relativité restreinte est en fait une théorie de la structure abstraite de l’es­pace-temps. Lévy-Leblond propose chronogéométrie, ce qui est bien sûr moins parlant que les termes de relativité restreinte. D’autre part, la dénomination de théorie de la rela­tivité générale est abusif. Il vaudrait mieux parler de théorie einsteinienne de la gravita­tion [37].

De plus, la théorie de la relativité n’est pas toujours bien comprise. Par exemple, le se­cond postulat sur l’invariance de la vitesse de la lumière garde toujours une place de choix dans les exposés. Or, il est caduc et inutile. La notion de rapidité qui seule est une grandeur additive permet de sortir des faux mystères de la vitesse limite.

4) Sens du principe de relativité

a) Difficulté de la notion

Avouons-le, le terme n’est pas heureux et fut l’occasion de multiples méprises. Déjà, il y a 50 ans, Sommerfeld constatait que la théorie d’Einstein, loin de faire tomber dans le relativisme, n’avait pas d’autres buts que de dégager de nouveaux absolus, plus rigou­reux, plus invariants que ceux de la relativité galiléenne, que la nouvelle théorie réfutait.

Allons du plus général au plus particulier. Il faut en effet distinguer le principe général de relativité des différentes théories qui permettent de l’incarner, de l’exprimer.

b) Le principe de relativité en général

Je suivrai l’exposé très pédagogique de l’excellent vulgarisateur qu’est Jean-Marc Lévy-Leblond, très attentif à cette question, dans son article : « La relativité aujourd’hui ». De la manière la plus générale et la plus intuitive, le principe de relativité estime « qu’il existe sur l’univers physique des points de vue équivalents. Par «point de vue», j’en­tends ici ce que les physiciens explicitent sous le nom de «référentiel» : un système de référence à quoi sont rapportées les diverses grandeurs physiques [38] ».

En effet, prenons la description d’un mouvement, précisément de sa vitesse. Celle-ci sera différente selon que je l’observe dans le train : l’homme marche à une vitesse de 5 km/h, et selon que je suis sur le quai devant lequel défile le train qui lui-même roule à 100 km/h ; alors, la vitesse de cet homme sera pour moi de 5 + 100 = 105 km/h. Or, cou­loir du train et quai de gare sont des référentiels physiques différents. « Il est donc né­cessaire, a priori, lorsqu’on écrit une loi physique, c’est-à-dire une relation entre gran­deurs physiques, de bien spécifier le référentiel utilisé [39] ».

Or, si l’on considère différents référentiels, on peut distinguer les référentiels divers et les référentiels équivalents. On appellera référentiels équivalents des référentiels où les phénomènes physiques ont même allure et les lois de la physique la même forme. Précisons : les grandeurs physiques différeront, puisque les référentiels sont divers et non pas identiques ; mais les relations entre les phénomènes demeurent invariants. Prenons un exemple de référentiels non-équivalents. Soit le mouvement d’une bille, sa description physique : dans un système au repos, le mouvement de la bille répond à des lois précises ; par exemple, une poussée en avant, unidirectionnelle, fera naître un mou­vement linéaire donné. Je place maintenant cette même bille dans un manège qui tourne, : même si je n’exerce aucune poussée sur la bille, celle-ci va se trouver en mou­vement, du fait de ce que l’on appelle la force centrifuge exercée par le manège en rota­tion. C’est donc que les lois physiques vont se trouver changées : les deux systèmes ne sont pas équivalents du point de vue de la physique.

Or, le principe de relativité affirme que, parmi la multitude infinie des référentiels, cer­tains sont équivalents ; plus encore, il formule les lois qui permettent de passer d’un réfé­rentiel à un autre.

c) Les différents principes de relativité

On peut déjà imaginer un principe de relativité ou d’équivalence eu égard à l’espace. C’est le plus immédiat, et fait l’objet d’une intuition qui n’a jamais été mise en question : « les lois de la physique ont certainement la même expression dans un laboratoire fran­çais et un laboratoire américain [40] ».

Galilée a élaboré un principe de relativité qui est moins évident, puisqu’il a fallu at­tendre bien des siècles avant qu’il soit formulé. Jusqu’à lui, la physique aristotélicienne distinguait radicalement les objets en mouvement et les objets en repos, de sorte qu’il n’y avait aucune équivalence possible des lois physiques entre les deux types d’objet ; en revanche, le principe de relativité vaut pour deux systèmes au repos ou animés de la même vitesse, etc. Pour Galilée, sont équivalents deux systèmes animés par un mouve­ment uniforme, quelle que soit la vitesse du système, celle-ci pouvant être nulle. Il s’op­pose donc radicalement au principe aristotélicien de la différence entre mouvement et repos. En une page célèbre, Galilée note que les lois physiques sont indifférentes au fait que le bateau soit à quai ou se déplace d’un mouvement constant, uniforme. Nous en faisons d’ailleurs l’expérience lorsque nous nous trouvons dans un train (lieu d’expé­rience très prisée des physiciens relativistes !) et que nous voyons le train voisin bouger lentement ; il n’est pas rare qu’un doute nous prenne : est-ce lui ou nous qui sommes en mouvement ? La seule manière de vérifier est de prendre un repère autre, extérieur sensé être fixe. Mais imaginons qu’il n’y en ait pas : en ce cas, nous serions incapable de savoir si le train est au repos ou en mouvement uniforme ; dès lors, tout mouvement pa­raît relatif. « C’est cette indifférence du mouvement – uniforme ! – qui constitue le cœur même du principe de relativité, entraînant ipso facto l’abolition de toute idée de mouve­ment absolu [41] ». Tel est l’énoncé du principe de relativité, dans le cadre d’une physique galiléenne : tous les référentiels animés d’un mouvement uniforme sont équivalents. Autrement dit, aucune expérience de physique ne permet de discriminer si le système est en mouvement uniforme ou en repos, d’affirmer que tel système est ou non au repos.

Une application immédiate et étonnante sur laquelle nous reviendrons est l’impossibi­lité par exemple d’élaborer une expérience physique mécanique permettant de détermi­ner si la Terre est animée d’un mouvement de rotation autour du soleil. En effet, ce mou­vement est uniforme. Certes, nous observons bien que Terre et Soleil bougent l’un par rapport à l’autre. Mais nous sommes dans la même situation qu’un passager de train qui voit un autre train bouger : quel est le train qui se déplace ? Sauf que nul quai de gare a priori fixe, nul troisième terme permet de trancher la question de l’observateur terrestre. Observer ce mouvement depuis un satellite ne ferait que reculer le problème.

Une autre conséquence du principe de relativité galiléen est ce que l’on appelle le principe d’inertie. Il est intéressant de comprendre qu’il découle du premier. L’expérience courante qui a longtemps alimenté la physique péripatéticienne dit que tout corps sur lequel ne s’exerce aucune force s’arrête, est au repos. Or, le principe de rela­tivité galiléen énonce que ce corps n’est pas au repos, mais mobile, animé d’un mouve­ment uniforme. En effet, un corps au repos dans un référentiel donné (la personne assise dans le train qui se déplace à vitesse constante) apparaît en mouvement uniforme pour un autre observateur, d’un autre référentiel (sur le quai de la gare). Or, le repos vient de ce qu’aucune force ne s’exerce sur le mobile. C’est donc que le référentiel en mouve­ment uniforme est doué de la même caractéristique physique : aucune force ne s’exerce sur lui. C’est ce qu’énonce le principe d’inertie (cf. ci-dessus).

d) Formalisation du principe de relativité galiléen

Le physicien passe de l’expression concrète intuitive du principe de relativité à sa for­malisation, en construisant des formules de transformation. Ces formules permettent de passer d’un référentiel à l’autre en conservant identiques les lois physiques, en leurs formes (en leurs nombres nombrants, pas en leurs paramètres concrets, en leurs nombres nombrés). Or, « les plus fondamentales de ces formules, sinon les plus impor­tantes en pratique, concernent l’espace et le temps. Autrement dit, il faut savoir exprimer les coordonnées spatio-temporelles d’un événement, c’est-à-dire en repérer le lieu et l’instant, dans deux référentiels en mouvement relatif uniforme [42] ». C’est ce qu’opère les formules dites galiléennes. La position x’ d’un événement par rapport au référentiel R’ (le train, par exemple, le wagon de queue) s’obtient en soustrayant à sa position x par rapport au référentiel R (le quai, par exemple, le bout du quai), la distance parcourue à la vitesse v pendant le temps t écoulé depuis le passage du train. Sous forme d’équation, cela apparaîtra plus simple :

 

x’ = x – vt

 

Vous constaterez que l’on considère implicitement que les deux temps t et t’ des deux référentiels R et R’ sont égaux.

e) Le principe de relativité einsteinien

Jusqu’en 1905, l’on n’a jamais remis en question ce principe de relativité tant il paraît trivial et correspondre au bon sens. Il a fallu attendre le génie d’Einstein pour le discuter. Ce principe suppose en effet que le temps écoulé, les distances mesurés soient les mêmes dans les deux référentiels. Plus fondamentalement, il postule qu’il existe des phénomènes réellement simultanés. Or, rien n’est moins certain. Et c’est là où Einstein intervient.

f) Analyse einsteinienne de la simultanéité

L’originalité géniale d’Einstein est d’avoir remis en question une autre paramètre, que personne ne s’était avisé de remettre en question ; Einstein a su repérer le présupposé implicite, le postulat tellement enfoui que plus personne n’y songeait : le postulat du temps absolu. On avait remis en question les longueurs, on discutait à perte de vue sur les propriétés électromagnétiques de la matière, mais nul ne s’était avisé que le temps en question apparaissait toujours indépendant des observateurs, c’est-à-dire du système de référence. Einstein va mettre en relief l’erreur de ce postulat, en faisant appel à la no­tion de simultanéité. Il lui faut pour cela d’abord obtenir une définition de la simultanéité, puis l’appliquer aux questions qui nous intéressent. En physique, les définitions sont non pas d’abord ontologiques, mais opérationnelles, ainsi que le montre le cours d’épistémo­logie. Définir la simultanéité, c’est donner le moyen de la mesurer, c’est décrire l’expé­rience canonique de son obtention, de sa mesure.

g) Définition de la simultanéité

Quand on pense simultanéité, on songe souvent implicitement à des événements proches. Pour reprendre l’exemple que donne Einstein, si je dis que « le train arrive ici à 7 heures », cela signifie que « le passage de la petite aiguille de ma montre à l’endroit mar­qué 7 et l’arrivée du train sont des événements simultanés [43] ». Il est aisé de déterminer ainsi des événements simultanés se déroulant au voisinage immédiat de ma montre.

Qu’en est-il maintenant lorsque les événements dont on se demande s’ils sont simulta­nés sont éloignés l’un de l’autre ? Einstein imagine un dispositif expérimental permettant de trancher la question : deux événements sont-il ou non simultanés ? Soit la foudre qui tombe simultanément en deux points A et B d’une voie ferrée, éloignés l’un de l’autre. « On mesure la distance AB en ligne droite le long de la voie, et l’on installe au milieu M un observateur muni d’un appareil (par exemple deux miroirs inclinés à 90°) lui permet­tant d’observer simultanément les deux points A et B. Si l’observateur aperçoit les deux éclairs en même temps, ils sont simultanés [44] ».

On définira donc la simultanéité de la manière suivant : « deux événements qui se pro­duisent en deux points A et B d’un même système sont simultanés si des signaux émis en A et B et concomitant à ces événements, arrivent en même temps au milieu M de AB [45] ». Voilà qui semble clair et absolu, universel.

h) Application au cas de la lumière

Il se trouve que l’on prend comme signal le plus performant, c’est-à-dire le plus rapide, à savoir la lumière. L’idéal serait que la vitesse de ce signal soit instantanée. Mais nous savons que la vitesse de la lumière est finie. Il faudra donc synchroniser les signaux. Or, nous allons voir qu’en utilisant cette définition de la simultanéité, celle-ci devient diffé­rente dans un autre système galiléen.

Reprenons l’exemple classique du train. Maintenant, sur la voie ferrée précédente roule un train en mouvement rectiligne et uniforme, autrement dit à vitesse constante v. Il y a « deux systèmes de référence : l’un, S, est lié à la voie ferrée ; l’autre S’ au train » qui se déplace à la vitesse v par rapport à S. Soient deux observateurs, l’un sur la voie, l’autre dans le train. Supposons, comme précédemment, que la foudre tombe simultanément aux deux points A et B, frappant aussi bien le train que la voie et laissant des marques permanentes de son action. Quand ces événements ont lieu, ce sont les points A’ et B’ du train qui coïncident avec les points A et B de la voie. Chaque observateur a pu vérifier ensuite que son appareil d’expérimentation (par exemple deux miroirs inclinés à 90°) était placé exactement au milieu (M ou M’) des marques (A, B, A’, B’) laissées par la foudre ! Pour l’observateur de la voie, les deux éclairs A et B sont simultanés : les rayons lumineux issus de A et de B arrivent en même temps à l’observateur M situé au milieu de AB, sur la voie. Ces deux événements (les deux éclairs), simultanés par rapport à la voie (système S) sont-ils également simultanés par rapport au train (système S’) ? Einstein montre qu’il n’en est rien ». Et voilà le point essentiel : « L’observateur M’ du train coïncide bien avec M quand les éclairs se produisent. Mais M’ se déplace avec le train par rapport à la voie et ne coïncide plus avec M quand les signaux arrivent en M. Il va «à la rencontre de la lumière qui lui vient de B, tandis qu’il fuit devant la lumière lui venant de A». L’observateur M’ conclure donc que «l’éclair B a été antérieur à l’éclair A». Si un autre train se déplace en sens contraire du précédent, un observateur M » de ce train S » conclura au contraire que c’est l’éclair A qui est antérieur à l’éclair B. Or, la simultanéité a été définie comme la coïncidence de l’arrivée des signaux au milieu de A’B’ [46] ».

Einstein ayant le génie des exemples bien choisis, il est aisé d’abstraire à partir de ce cas singulier, prégnant de l’essence qui y affleure, la proposition universelle suivante : « la notion de simultanéité n’a pas de signification absolue […]. Des événements simulta­nés pour un système galiléen S ne le sont pas pour un autre système galiléen S’ ou S ». La simultanéité a seulement une signification relative à un système d’inertie déterminé [47] ».

Désormais, la transformation de Galilée n’est plus valable, car elle ne tenait pas compte de la relativité de la simultanéité.

5) Einstein, prophète du scepticisme relativiste ?

a) Exposé de cette opinion

Une idée reçue est qu’Einstein est le grand prophète scientifique du relativisme. En ef­fet, le Time magazine dans son numéro du 24 septembre 1979, contenait un placard publicitaire où le message publicitaire suivant, en gros caractères était illustré par la photographie d’Einstein : Tout est relatif. Or, « la règle la plus élémentaire, en matière de publicité, est de s’appuyer sur des croyances communes, sur des envies, espoirs ou craintes généralement partagées, bref sur un climat de pensée dominant [48] ».

En fait, le drame vient de l’utilisation malencontreuse du vocabulaire par Einstein. C’est lui qui a prêté à confusion, lorsqu’il parla dans son article de 1905, fondateur de la nou­velle théorie, du principe de la relativité : le mot est d’Einstein lui-même. C’est Einstein qui y dit que « les phénomènes électrodynamiques, aussi bien que ceux de la mécanique, ne possèdent aucune propriété qui corresponde à l’idée d’un repos absolu [49] ».

b) Critique de cette opinion

Mais cette opinion est profondément erronée. En fait, les pensées d’Einstein étaient profondément absolutistes, au sens non pas dogmatique ou politique, mais épistémolo­gique du terme.

« Dès 1924, dans une conférence intitulée «Du relatif à l’absolu», Max Planck avait sug­géré que la théorie einsteinienne de la relativité contient des éléments de caractère «absolutiste» [50] ». Or, Einstein est absolument d’accord avec l’interprétation de Planck, ainsi qu’on peut s’en convaincre en lisant la contribution d’Einstein, en 1931, au volume commémoratif en l’honneur de Maxwell. Elle commence par la célèbre déclaration : « La croyance en l’existence d’un monde extérieur indépendant du sujet qui le perçoit est al base de toute science naturelle ». Si l’on veut être épistémologiquement rigoureux, c’est en fait une assertion non pas dogmatique mais réaliste ; mais le réalisme inclut le dog­matisme.

De plus, 20 après, en 1950, le cercle de Vienne se regroupa aux États-Unis, et il essaie de gommer quelques mots trop absolus d’Einstein ; mais celui-ci ne les encouragea pas, quoiqu’il fût très conscient de ce qu’ils allaient l’accuser du « péché originel de métaphy­sique ». En effet, en son dernier essai sur la relativité, en 1950, Einstein affirme : « Tout véritable théoricien est un métaphysicien apprivoisé, même s’il croit être un pur positi­viste [51] ». Einstein entend par métaphysicien un réaliste qui croit que le réel ne se réduit pas au seul observable et donc à sa relativité.

c) Confirmation a contrario par les aveux des positivistes

C’est un point très enrichissant d’histoire des sciences, qui relativise beaucoup (c’est le cas de le dire !) nos convictions sur la prétendue objectivité et impartialité des cher­cheurs.

Jamais les positivistes des années 50 et 60, au moins aux États-Unis, Franck, Reichenbach, Carnap, Feigl, n’ont cité les affirmations réalistes d’Einstein. « Leur silence systématique sur plus d’une affirmation et plus d’un fait important était une pièce de la stratégie qu’ils poursuivaient. Plutôt que de stratégie, il faudrait même parler de croisade. Reichenbach lui-même affirma que le positivisme logique devait être considéré comme une croisade et non comme une entreprise philosophique abstraite. Les croisades intel­lectuelles ont leur logique propre, le positivisme logique n’en était pas exempt. Herbert Feigl l’a admis il y a plus d’une décennie : «Se confesser, dit-on, fait du bien à l’âme. Il n’est pas douteux que nous [positivistes logiques] avons maquillé un ou deux faits d’his­toire des sciences pour les faire coller avec nos théories.» [52]«

Mais quelle est la cause de cet aveu étonnant ? Jaki poursuit : « Une telle confession, plutôt accablante pour les positivistes logiques ou autres, qui font profession de ne res­pecter que les faits, n’est pas spontanée. Elle intervient plutôt lorsqu’une illusion amou­reuse caressée et entretenue se trouve brutalement démasquée ». Or, ce fut le cas ici, et cela confirme le réalisme d’Einstein. En effet, deux études détaillées de Gérard Holton [53] démasquent et crèvent la baudruche sur le positivisme d’Einstein.

d) Conclusion

L’apport de la théorie de la relativité, estime Gustave Martelet, réfute l’ancienne conception mécaniste selon laquelle temps et espace précèdent les corps : « La représen­tation spontanée et commode d’un contenant dont le monde serait le contenu, doit être remplacée par celle, difficile entre toutes à penser et qui nous vient d’Einstein, que le monde est à lui-même son propre contenant. Physiquement parlant, il n’y a pas d’en de­hors du monde. Etant à lui-même son propre espace, le monde est aussi à lui-même son propre temps. De même qu’il n’est pas dans l’espace mais que tout l’espace est en lui, de même le monde n’est pas dans le temps, mais c’est le temps qui est en lui [54] ». Je préciserai deux points : ce que Martelet appelle « la représentation spontanée et com­mode » n’est telle qu’à cause de la blessure imposée par la vision mécaniste dans la­quelle nos études et les médias nous font baigner depuis la plus jeune enfance ; l’autre représentation qui est la réalité-même, avec laquelle Einstein renoue n’est donc « difficile entre toutes » qu’à raison de la blessure infligée à l’imagination et à l’intelligence par la prégnance de la représentation mécaniste.

Pascal Ide

[1] Fritjof Capra, Le tao de la physique, trad., Paris, Éd. Sand, nouvelle éd., 1985, p. 55.

[2] « Préface » de L’avenir de la science, Éd. de poche présentée par Annie Petit, coll. « GF » n° 765, Paris, Flammarion, 1995, p. 72.

[3] Douglas Hofstadter, Gödel, Escher, Bach. Les Brins d’une Guirlande Eternelle, Version française Jacqueline Henry et Robert French, Paris, InterEditions, 1985, p. 19.

[4] Cf. J. N. Crossley, C. J. Ash, C. J. Brickhill, J. C. Stillwell, N. H. Williams, What is Mathematical Logic ?, New York, 1990, p. 20-30.

[5] Bibliographie. Outre l’agréable et astucieux (et volumineux) ouvrage introductif de Hofstadter qui vient d’être cité, la référence la plus philosophique demeure Jean Ladrière, Les limitations internes des formalismes. Étude sur la signification du théorème de Gödel et des théorèmes apparentés dans la théorie des fondements des mathématiques, coll. « Logique mathématique. Série B », II, Louvain, E. Nauwelaerts, Paris, Gauthiers-Villars, 1957. Ce passionnant ouvrage présente une abondante bibliographie sur le sujet. Il l’aborde du double point de vue philosophique et logique. Sur la légitimité et la situation d’une approche philosophique du théorème de Gödel, cf. la remarque préalable de la conclusion, p. 400 à 402. Cf. du même, « Les Limitations des formalismes et leur signification philosophique », in Dialectica n° 14, 1960. E. Nagel, J. R. Newmann, Kurt Gödel et Jean-Yves Girard, Le théorème de Gödel, Paris, Seuil, 1989.

[6] Pour le détail vous pouvez vous référer aux ouvrages classiques de Blanché ou de Kleene. Jean Ladrière fait aussi une présentation historique très claire de l’apparition des systèmes formels. Cf. aussi les travaux de Dominique Dubarle.

[7] Jean Ladrière, Les limitations internes des formalismes, p. 51-52.

[8] Ibid., p. 40.

[9] L’exposé technique est donné par Jean Ladrière, Ibid., chapitre 3. Si l’on veut un énoncé formel, exposé en logique symbolique, on peut se reporter à la p. 130. Le mécanisme général de la démonstration de Gödel est esquissé p. 102 à 104 ; un résumé du mémoire de Gödel sur les propositions indécidables est donné p. 445 à 454 (en note I). Enfin, différents exposés non-techniques du théorème de Gödel sont donnés en note II (p. 455 à 471), dont l’un sous forme non symbolique et très originale, l’exposé de Findlay (p. 466 à 470). Nous y renvoyons.

[10] Ibid., p. 93.

[11] Ibid., p. 403.

[12] Douglas Hofstadter, Gödel, Escher, Bach, p. 19.

[13] Jean Ladrière, Les limitations internes des formalismes, p. 317.

[14] Cf. Ernest Nagel et J. R. Newman, Gödel’s Proof, New York, New York University Press, 1958.

[15] C’est ce qu’exprimait le philosophe Stanislas Breton, Du Principe. L’organisation contemporaine du pensable, coll. « Bibliothèque des sciences religieuses », Paris, Aubier-Montaigne, Le Cerf, Delachaux et Niestlé, DDB, 1971, notamment p.165-168) « Ce théorème de limitation peut s’énoncer ainsi «Pour tout langage-objet, quel qu’il soit, un certain x (que nous appelons «principe») est ineffable». Nous appelons «limite» au sens strict cette impossibilité de dire le principe dans un langage-objet » (p. 169).

[16] Ernest Nagel et J. R. Newman, Gödel’s Proof, New York, New York University, 1958.

[17] Robert Blanché, La logique et son histoire, Paris, 1970, p. 361.

[18] Anton Dimitriu, « Le problème des paradoxes logico-mathématiques », in Scientia, Juillet-août 1968, p. 4-5.

[19] Ibid.

[20] Roger Caratini, L’année de la science 1990 (troisième année), Paris, Robert Laffont, 1989, p. 324.

[21] Jean-Paul Delahaye, « La conjecture de Syracuse », in Pour la science n° 247, mai 1998, p. 100 à 105. Avec bibliographie.

[22] Jean-Paul Delahaye, « Une extension spectaculaire du théorème de Gödel l’équation de Chaitin », in La Recherche, n° 200, vol. 19, juin 1988, p. 860-862.

[23] Ce nom vient de Diophante d’Alexandrie, célèbre mathématicien grec de l’Antiquité (iiie siècle) il s’agit d’une équation qui ne fait intervenir que des nombres entiers et les opérations d’addition, de multiplication et d’élévation à la puissance.

[24] Gregory Chaitin, « Le hasard en théorie des nombres », in Pour la science, n° 131, septembre 1988, p. 82 à 87, ici p. 86. Voir cet article pour une première approche technique de la démonstration.

[25] Ibid.

[26] Jean-Paul Delahaye, « Une extension spectaculaire du théorème de Gödel l’équation de Chaitin », p. 862.

[27] Stephen Hawking, Une brève histoire du temps, p. 30-31.

[28] Abdus Salam, W. Heisenberg et Paul Adrien Maurice Dirac, La grande unification. Vers une théorie des forces fondamentales, trad. Jean Kaplan et Alain Lavere, Paris, Seuil, 1991, p. 75.

[29] Bibliographie sélective :

  1. a) Primaire

Œuvres choisies, trad. sous la direction de Françoise Balibar, Paris, Ed. du CNRS et du Seuil, 1989 1. Quanta. 4. Correspondances françaises. 5. Science, éthique, philosophie. 6. Écrits politiques. Volumes 2 et 3 pour 1993.

Réflexions sur l’électrodynamique, l’éther, la géométrie et la Relativité, trad. Maurice Solovine et M.A. Tonnelat, coll. « Discours des la méthode », Paris, Gauthiers-Villars, nouvelle éd., 1972. Nous y trouvons notamment le fameux article programmatique de juin 1905 « Sur l’électrodynamique des corps en mouvement », p. 1 à 52. S’y ajoute un court article où il établit la conséquence capitale de l’équivalence de la matière et de l’énergie, p. 53 à 57 (Berne, septembre 1905). « La masse d’un corps est la mesure de sa capacité d’énergie » (p. 57).

Comment je vois le monde, trad. Maurice Solovine et Régis Hanrion, Paris, Flammarion, 1958, repris en coll. « Champs », 1979. Nouvelle trad. in Œuvres choisies, 5,54.

Conceptions scientifiques, morales et sociales, trad. Maurice Solovine, Paris, Flammarion, 1952.

L’évolution des idées en physique. Des premiers concepts aux théories de la relativité et des quanta, trad. Maurice Solovine, Paris, Petite Bibliothèque Payot, n° 47.

Quatre conférences sur la théorie de la relativité, Paris, Gauthiers-Villars, 1971.

La théorie de la relativité restreinte et générale. Exposé élémentaire, Paris, Gauthiers-Villars, 1954, 1976.

  1. b) Secondaire

1’) Biographie d’Einstein

– Jacques Merleau-Ponty, Einstein, « Figures de la science », Paris, Flammarion, 1993. Avec bibliographie.

– A. Pais, Subtle is the Lord. The Science and Life of Albert Einstein, Oxford, Oxford University Press, 1982. Trad. fr., Paris, InterEditions, 1994.

2’) Études scientifiques sur la Relativité

– Collectif, sous la direction de E. Noël, L’espace et le temps aujourd’hui, Paris, Seuil, 1983.

– Paul Couderc, La relativité, « Que sais-je ? », n° 37, Paris, PUF, 1941, 151973. Une excellente introduction qui demeure indépassable, même si l’auteur est un rationaliste impénitent et bavard et si la coll. À jugé légitimement qu’il fallait actualiser une nouvelle étude du thème, moins enthousiaste et moins enthousiasmante, mais plus technique, plus pédagogique, plus rigoureuse, par Stamatia Mavridès (première édition 1988).

– Th. Damour et S. Deser, art. « Relativité », Encyclopædia Universalis. Un bon exposé, estime Lévy-Leblond

– L. Landau, A. Rumer, Qu’est-ce que la relativité ?, Moscou, Mir, 1967.

– Jean-Marc Lévy-Leblond, Les Relativités, Cahiers de Fontenay, École Normale Supérieure de Fontenay-aux-Roses, 1977. « La relativité aujourd’hui », in La Recherche, n° 96, janvier 1979, repris dans l’Encyclopédie philosophique universelle. I. L’univers philosophiques, dir. Sylvain Auroux, Paris, PUF, 1989, p. 1128-1133.

– Stamatia Mavridès, L’univers relativiste, Paris, Masson, 1973.

– J. H. Smith, Introduction à la relativité, Paris, InterEdition, 1973.

– E. F. Taylor, J. A. Wheeler, A la découverte de l’espace-temps, Paris, Dunod, 1970.

– M. A. Tonnelat, Histoire du principe de relativité, Paris, Flammation, 1971.

– Stephen Weinberg, Les trois premières minutes de l’univers, Paris, Seuil, 1978.

3’) Interprétations philosophiques

– Costa de Beauregard, « De la lecture du grand livre du monde. Réflexions sur les enjeux de la Mécanique quantique et de la Relativité », in Revue des Questions Scientifiques, 1988, 159 (1), p. 81-107.

– Stanley L. Jaki, « L’absolu au-delà du relatif. Réflexions sur Einstein », in Communio XVII, 4, Juillet-août 1992, p. 135 à 149. Il est regrettable que les citations de cet intéressant article ne soient pas référencées.

[30] Paul Couderc, La relativité, coll. « Que sais-je ? » n° 37, Paris, PUF, 1973, p. 52 à 54.

[31] Ibid., p. 55.

[32] Stamatia Mavridès, La relativité, p. 44. Cf. les schémas de M. À Tonnelat, Histoire du Principe de relativité, p. 137.

[33] Jean-Marc Lévy-Leblond, « La relativité aujourd’hui », Encyclopédie philosophique universelle, ici p. 1130.

[34] Jean-Marc Lévy-Leblond, « La relativité aujourd’hui », ici p. 1132.

[35] Jean-Marc Lévy-Leblond, « La relativité aujourd’hui », La Recherche n° 316, janvier 1999, p. 83.

[36] Cela a valu le Prix Nobel à R. A. Hulst et J. A. Taylor, en 1993.

[37] Sur ces questions, cf. Jean-Marc Lévy-Leblond, Aux contraires, Paris, Gallimard, 1996, chap. 4 « Absolu/relatif ».

[38] Jean-Marc Lévy-Leblond, « La relativité aujourd’hui », in Encyclopédie philosophique universelle. I. L’univers philosophiques, dir. Sylvain Auroux, Paris, PUF, 1989, p. 1128-1133, ici p. 1128.

[39] Ibid.

[40] Ibid., p. 1129.

[41] Ibid.

[42] Ibid., p. 1130.

[43] Albert Einstein, Réflexions sur l’électrodynamique, l’éther, la géométrie et la Relativité, trad. Maurice Solovine et M.A. Tonnelat, coll. « Discours des la méthode », Paris, Gauthiers-Villars, nouvelle éd., 1972.

[44] Ibid., p. 18.

[45] Stamatia Mavridès, La relativité, p. 32. Souligné dans le texte. Nous suivons son exposé très clair sur la notion de simultanéité.

[46] Ibid., p. 33 et 34.

[47] Ibid., p. 34 et 35.

[48] Stanley L. Jaki, « L’absolu au-delà du relatif. Réflexions sur Einstein », in Communio XVII, 4, Juillet-août 1992, p. 135 à 149, ici p. 135.

[49] Cité Ibid., p. 140.

[50] Ibid., p. 135.

[51] Cité Ibid., p. 136.

[52] Cité Ibid., p. 136.

[53] Einstein et la quête du réel et Einstein, Michelson et l’expérience cruciale (1968 et 1969).

[54] Gustave Martelet, évolution et création. 1. Sens ou non-sens de l’homme dans la nature, coll. « Théologies », Montréal, Éd. Médiaspaul, Paris, Le Cerf, 1998, p. 34.

23.9.2021
 

Comments are closed.