Dans les années 60, John Bell découvrit que la mécanique quantique était incompatible avec l’existence d’une réalité physique indépendante des observateurs humains, sauf à devoir accepter l’impossibilité de réaliser deux observations indépendament l’une de l’autre, même si les deux observateurs sont très loin l’un de l’autre. Ce théorème eut un grand retentissement car il réduisait énormément les espoirs, portés en partie par Einstein dans les années 30, d’une refondation de la mécanique quantique sur des bases proches de la physique classique.
En effet, un des piliers de cette dernière est le réalisme: l’hypothèse d’une réalité physique indépendante de tout observateur, que nous cherchons à cerner du mieux que nous pouvons d’une part en effectuant des observations quantitatives, ou mesures, et d’autre part, en élaborant des modèles mathématiques pour prédire les résultats de ces mesures. La tension entre la mécanique quantique et le réalisme n’apparaît que pour certaines classes de systèmes bien particulières, certes, mais c’est suffisant pour mettre en doute le réalisme en tant que base de la physique. Par la suite, de nombreux résultats similaires furent découverts par d’autres chercheurs, et ils furent tous nommé théorème de Bell, en l’honneur de ce dernier. En particulier, plusieurs inégalités de Bell furent prouvées dans les années 1970 puis testées expérimentalement.
Dans cet article, je vais présenter en détails une de ces inégalités. Je vais montrer comment elle est la conséquence des hypothèses de réalisme et de localité appliquées à un dispositif expérimental simple. Je montrerais ensuite que les prédictions de la mécanique quantique violent ces inégalités. Cette expérience n’est pas réalisable en pratique mais des variantes furent réalisées. Les résultats donnèrent raison à la mécanique quantique: les inégalités de Bell étaient belle et bien violées. Je donnerais les références des expériences les plus marquantes.
Je vais présenter une expérience idéalisée. Nombre des expériences réelles furent réaliser avec des paires de photons mais je vais considérer des paires d’électrons pour des raisons historiques et pédagogiques. Les paires d’électrons avec leur spin fortement corrélés furent en effet l’expérience de pensée que Bell utilisa pour démontrer les inégalités qui portent maintenant son nom. Une expérience récente et importante, (Hensen, Bernien, Dreau, Reiserer, Kalb, Blok, Ruitenberg, Vermeulen, Schouten, Abellan, Amaya, Pruneri, Mitchell, Markham, Twitchen, Elkouss, Wehner, Taminiau et Hanson, 2015), fut réalisée avec de telles paires mais les détails expérimentaux diffèrent significativement de l’expérience idéalisée que je vais présenter: c’est un choix pédagogique de ma part.
Il y a en premier lieu une source qui émet une à une des paires d’électrons qui sont, est-il besoin de le rappeler, des particules de spin 1/2. Ces paires sont produites dans un état de spin total nul. Pour chaque paire, l’une des particules, notée 1, va vers un appareil de mesure I tandis que l’autre, notée 2, va vers un appareil de mesure II. Le détecteur I va mesurer le spin de la particule 1 dans la direction \(a\) (un vecteur unitaire) tandis que le détecteur II mesurera le spin de la particule 2 dans la direction \(b\) (un autre vecteur unitaire, à priori différent de \(a\)). Par conséquent, ces mesures ne peuvent prendre que les valeurs \(\pm\hbar/2\). Par soucis de concision, je vais mesurer les spins en unité de \(\hbar/2\), et par conséquent les mesures ne prendront que les valeurs \(\pm 1\).
On répète la mesure un grand nombre \(N\) de fois, et on calcule alors
\[D_N(a,b) = \frac{N_\text{identique}(a,b)-N_\text{différente}(a,b)}{N} \label{countingRatios},\]où \(N_\text{identique}(a,b)\) (resp. \(N_\text{différente}(a,b)\)) est le nombre de paires pour lesquelles les deux détecteurs ont mesuré la même valeur (resp. des valeurs différentes). Ces comptages dépendent à priori des réglages \(a\) et \(b\), ce que j’ai rendu explicite dans cette équation. Comme les mesures ne peuvent prendre que les valeurs +1 et -1, \(D_N(a,b)\) est la moyenne du produit de la mesure du détecteur I et du détecteur II, sur les \(N\) paires mesurées, c’est à dire ce que l’on appelle la corrélation entre les mesures des deux détecteurs.
Un point très important avant de passer au modèle est que la mécanique quantique fait une prédiction remarquable (que je démontrerais plus loin): si le réglage du détecteur I est \(a\) et le réglage du détecteur II est \(-a\) (ou l’inverse), alors le produit des deux mesures est toujours égal à -1, quelque soit la direction \(a\). Intuitivement, la paire ayant un spin nul, le spin de la particule 1 est toujours l’opposé de celui de la particule 2. Par conséquent, si un des détecteurs mesure la valeur 1 (respectivement -1), alors on peut prédire à coup sûr que l’autre détecteur va mesurer -1 (respectivement 1). Donc la mesure d’un des détecteurs détermine complètement celle de l’autre. Un point crucial est que cette prédiction reste correcte même si ni les deux particules, ni les détecteurs I et II ne peuvent pas communiquer entre eux au moment des mesures, ce dont on peut s’assurer en les plaçant suffisament loin l’un de l’autre, de manière que même un signal voyageant à la vitesse de la lumière ne puisse pas aller de l’un à l’autre à temps pour que la mesure faite par l’un influence celle faite par l’autre. Cette prédiction fut confirmée expérimentalement à maintes reprises.
On peut alors faire le raisonnement de (Einstein, Podolsky et Rosen, 1935). Comme ni les deux particules, ni les détecteurs ne peuvent intéragir, la mesure sur l’une des particules ne peut rien changer ni à l’autre particule, ni à l’autre détecteur. Mais pourtant, on peut déterminer à coup sûr la valeur du spin de la particule 2 (par exemple) selon la direction \(b\). Par conséquent, la composante du spin de la particule 2 dans cette direction avait la valeur que l’on mesure depuis le moment où la paire fut crée, ou du moins cette valeur fut fixée quand les deux particules étaient encore suffisament proches pour intéragir. On peut faire ce raisonnement pour les trois composantes du spin de la particule 2, selon les axes \(x\), \(y\) et \(z\), et on en déduit donc que toutes ces composantes avait une valeur bien déterminée longtemps avant la mesure. Mais il s’agit là d’un anathème du point de vue de la mécanique quantique car il n’existe aucun état de spin tel que les trois composantes puissent avoir une valeur bien déterminée. Einstein, Podolsky et Rosen en conclurent alors que la mécanique quantique ne saurait être une théorie complète. Il doit y avoir des variables cachées sous-jacentes aux spins, dont les valeurs sont bien déterminées avant les mesures, et qui font en sorte que les spins mesurés soient parfaitement corrélés. Einstein, Podolsky et Rosen n’allèrent pas plus loin, et ne proposèrent aucune théorie. Presque 30 ans plus tard, ce fut Bell (1964) qui prit leur raisonnement au sérieux: il construisit un modèle à variables cachées et analysa ses prédictions. Je vais maintenant présenter ce modèle.
L’information contenue dans chaque paire, ou du moins celle qui aura une influence sur les mesures, sera notée \(\lambda\), qui est aussi appelée l’état de la paire. À priori, on ne connaît pas \(\lambda\) exactement, car il contient les variables cachées dont nous venons de discuter. Il contient peut-être aussi les spins des particules mais cela n’a pas d’importance pour la suite.
Je voudrais insister sur deux points importants:
Toutes les inégalités de Bell résulte des deux hypothèses fondamentales de localité et de réalisme (en anglais Objective Local Theory, parfois abrégé en OLT). Nous allons maintenant les présenter en détails. Tout l’enjeu est de décrire précisément de quoi dépendent les mesures de \(A\) et \(B\).
Une théorie “réaliste” suppose l’existence d’une réalité indépendente de l’observateur et déterministe, ce qui constitue un des piliers de la mécanique classique. Une telle théorie introduit des probabilités, comme en physique statistique, uniquement parce que l’on ne peut pas décrire complètement les détails microscopiques des systèmes en jeu. Plus précisément, une telle théorie fait l’hypothèse que l’état de la paire \(\lambda\) est entièrement suffisant pour déterminer, conjointement avec les réglages des appareils, le résultat des mesures mais que l’état de chaque paire ne pouvant être connu, il nous faut introduire une mesure de probabilité \(\rho\) sur l’ensemble \(\Lambda\) des valeurs pouvant être prises par \(\lambda\). Par conséquent, cette mesure ne dépend que du mécanisme de production des paires et donc pas des réglages des appareils de mesure, un point très important pour démontrer les inégalités de Bell. Notons que nous n’avons à priori aucune idée de la forme que peut prendre \(\rho\), et que cette information n’est pas nécessaire pour démontrer les inégalités de Bell.
Ce critère s’exprime ainsi: l’appareil de mesure I fonctionne indépendamment de l’appareil de mesure II. On pourrait imaginer à l’inverse que des facteurs extérieurs influencent les deux appareils, créant ainsi une corrélation entre les mesures, ou bien qu’un des appareils envoit, juste après avoir fait sa mesure, une information à l’autre, juste avant que ce dernier ne fasse sa mesure, influençant ainsi celle-ci. La conséquence essentielle de ce postulat est que, combiné avec le critère de réalisme, la mesure \(A\) par l’appareil I ne peut dépendre que du réglage \(a\) de cet appareil et de l’état de la pair \(\lambda\). On notera donc \(A(a, \lambda)\). Et de même pour l’autre mesure, \(B(b, \lambda)\), qui ne dépend que de \(\lambda\) et du réglage \(b\) de l’appareil II.
On pourrait être tenté d’aller plus loin et de dire que \(A\) ne peut dépendre que de l’état de la particule 1 mais comme cet état peut être corrélé avec celui de la particule 2, cette hypothèse est en générale fausse. Le critère de localité, qui s’applique aux analyseurs, n’est donc pas équivalent au critère de séparabilité, comme nous l’avions déjà mentionné plus haut.
La quantité mesurée étant la corrélation entre les mesures sur les membres d’une paire comme nous l’avons expliqué plus haut, le point de départ est donc l’expression de cette corrélation dans notre modèle,
\[P(a,b) = \int_{\Lambda} A(a, \lambda) B(b, \lambda) d\rho(\lambda). \label{olt:corr}\]Avec un suffisament grand nombre \(N\) de paires, on aura alors \(D_N(a,b) \approx P(a,b)\). On voit que la moyenne qui apparaît dans \(D_N(a,b)\) devient naturellement une moyenne prenant en compte la distribution de l’états de la paire de particule.
Pour qui connait un peu la mécanique quantique, le formalisme que nous venons de décrire semble totalement incompatible avec la mécanique quantique la plus élémentaire, qui est pourtant est très bien vérifiée expérimentalement. En effet, pas d’espace de Hibert pour les états, ni d’opérateurs hermitiens pour les observables, et surtout pas de règle de Born pour calculer les probabiltés de mesure ici. Mais il faut bien se rendre compte que ce formalisme quantique est juste un outil pour prédire la seule chose que l’on puisse effectivement mesurée: la distribution statistique des résultats de mesure. Si une théorie réaliste et locale peut prédire la même distribution que la théorie quantique, alors on ne peut la rejeter. Je pense donc qu’il est important de construire explicitement une théorie réaliste et locale capable de reproduire la mécanique quantique d’un spin 1/2. C’est ce que fit Bell dans l’article où il démontra les premières équations auxquelles on donna son nom par la suite (c.f. le tout début de la section III dans (Bell, 1964)) mais je vais utiliser la présentation de Mermin (1993), et de plus ne considérer que les mesures de spin dans des directions quelconques, tandis que aussi bien Bell que Mermin considèrent les observables les plus générales possibles.
Commençons par rappeler le formalisme quantique. Afin de coller au plus près avec les résultats classiques des livres de cours, jusqu’à nouvel ordre, et de toute façon pas plus loin que cette section 2.c, je vais mesurer les spins en unité de \(\hbar\) et non plus en unité de \(\hbar/2\). L’observable associée à la projection du spin dans une direction \(a\), un vecteur unitaire, est donc
\(S(a) = \frac{1}{2}(a_x\sigma_x + a_y\sigma_y + a_z\sigma_z)\),
où \(\sigma_x\), \(\sigma_y\) et \(\sigma_z\) sont les traditionelles matrices de Pauli. La mesure de cette projection du spin ne peut résulter qu’en l’une des valeurs \(\pm 1/2\). Considérons maintenant un système dans l’état quantique \(\kup{n}\) correspondant à un spin dans la direction \(n\), un autre vecteur unitaire. Cela veut dire que
\[S(n) \kup{n} = +\frac{1}{2} \kup{n}.\]Comme il n’y a que deux valeurs possibles d’une mesure de \(S(a)\), les probabilités de chacune peuvent se déduire l’une de l’autre. La probabilité de mesurer la valeur +1/2 est
\[P(a) = \frac{1}{2}(1 + a\cdot n).\label{spin:half:proba}\]C’est là un résultat classique que l’on peut trouver dans tous les bons livres mais afin que ce billet se suffise à lui-même, je vais les redémontrer avant de continuer. Le lecteur au fait de ces choses peut donc sauter directement à la suite du texte après le prochain CQFD!
En utilisant l’expression des matrices de Pauli, on a
\[\notag S(n) = \frac{1}{2}\begin{pmatrix} n_z & n_x - i n_y \\ n_x + i n_y & -n_z \end{pmatrix}.\]Comme \(n_x^2+n_y^2+n_z^2=1\), le polynome charactéristique est \(X^2 - \frac{1}{4}\), d’où les valeurs propres \(\pm\frac{1}{2}\). Un vecteur propre pour la valeur propre \(\frac{1}{2}\) est alors
\[\notag \ket{\psi}=\begin{pmatrix} n_x - i n_y \\ 1 - n_z \end{pmatrix}.\]La normalisation est donc \(\sqrt{2(1-n_z)}\), d’où
\[\kup{n} = \frac{1}{\sqrt{2}}\begin{pmatrix} \dfrac{n_x - i n_y}{\sqrt{1-n_z}} \\ \sqrt{1-n_z} \end{pmatrix}.\]Par conséquent, par la règle de Born,
\[\begin{align*} P(a) &= |\braket{a+}{n+}|^2 = \frac{1}{4}\left|\frac{(a_x + i a_y)(n_x - i n_y)}{\sqrt{(1-a_z)(1-n_z)}} + \sqrt{(1-a_z)(1-n_z)}\right|^2\\ &= \frac{1}{4}\left(\frac{(a_x^2+a_y^2)(n_x^2+n_y^2)}{(1-a_z)(1-n_z)}+(1-a_z)(1-n_z)+2\Re\left[(a_x+ia_y)(n_x-in_y)\right]\right) \end{align*}\]Comme \(a\) et \(n\) sont unitaires, le premier terme est en fait \((1+a_z)(1+n_z)\), donc
CQFD.
Il s’agit maintenant de construire un modèle local et réaliste reproduisant ces deux points. Pour l’état \(\lambda\) du système dans l’état quantique \(\kup{n}\), nous allons choisir la paire \((n,m)\) où le vecteur unitaire \(m\) est ici la variable cachée (ou plutôt les variables cachées car il a deux composantes indépendentes). Pour la distribution \(\rho(\lambda)\), nous allons choisir une distribution uniforme sur l’angle solide associé à \(m\). Il ne reste plus qu’à élaborer une observable \(S(a, \lambda)\) ne prenant que les valeurs \(\pm\frac{1}{2}\) (bien entendu, ce symbole \(S\) correspond à un tout autre object que ce même symbole dans le paragraphe précédent sur le formalisme quantique). L’équivalent de (\(\ref{olt:corr}\)) est ici
\[\expect{S(a)} = \int_\Lambda \rho(\lambda)S(a, \lambda)d\lambda,\]ou pour la probabilité d’observer la valeur +1/2,
\[P(a) = \int_\Lambda \rho(\lambda)\ \Theta\!\!\left(S(a,\lambda)=+\frac{1}{2}\right)d\lambda\]où \(\Theta(\cdots)\) est la fonction indicatrice du domaine des \(\lambda\) considéré, égale à 1 quand la condition est satisfatire, et égale à 0 sinon.
On va alors voir que le choix suivant convient:
\[S(a, n, m) = \begin{cases} +\frac{1}{2}, & \text{if } (n+m)\cdot a > 0,\\ -\frac{1}{2}, & \text{otherwise.} \end{cases}\]La probabilité ci-dessus s’écrit alors avec nos choix de densité de probabilité et de valeur de mesure,
\[\notag P(a) = \int\frac{d\Omega(m)}{4\pi}\Theta((n+m)\cdot a > 0).\]En introduisant des coordonnées polaires sphériques avec \(a\) comme axe des \(z\), le vecteur \(m\) est repéré par l’angle azimuthal \(\varphi\) et l’angle polaire \(\theta\) tandis que le vecteur \(n\) a un angle polaire \(\theta_n\).
\[P(a) = \frac{1}{4\pi}\int_0^{2\pi}d\varphi\int_0^\pi d\theta\sin\theta \ \Theta(\cos\theta_n + \cos\theta > 0),\]Comme les angles sont entre 0 et \(\pi\), la condition \(\cos\theta > -\cos\theta_n\) se réduit à \(\theta < \pi - \theta_n\). Comme l’intégrande ne dépend pas de l’angle azimuthal, l’intégration correspondante disparait en donnant un facteur \(2\pi\), et il reste donc
\[\notag P(a) = \frac{1}{2} \int_0^{\pi-\theta_n}\sin\theta d\theta = \frac{1}{2}(1+\cos\theta_n).\]CQFD.
Nous avons donc montrer que l’on pouvait construire un modèle réaliste et local qui reproduisait exactement les prédictions stastistiques de la mécanique quantique pour une particule de spin 1/2. Ce résultat fut une des surprises des travaux de Bell. Il montre qu’il faudra au moins un système de deux particules pour espérer trouver une contradiction avec la mécanique quantique, ce qui sera le sujet de la section suivante.
Mais au sujet de ces paires, il nous faut au moins montrer qu’un modèle réaliste et local peut reproduire les corrélations parfaites quand les détecteurs ont des réglages opposés, car ce fut le point de départ de notre raisonnement sur les variables cachées. Ce n’est guère difficile. Je vais bien entendu réutiliser le modèle que nous venons d’étudier pour chaque particule: la particule 1 a un état \((n,m_1)\), et la particule 2 a un état \((-n,m_2)\). L’une a \(n\) et l’autre \(-n\) pour réaliser des spins en direction opposée. Pour corréler les particules, il suffit alors de demander que \(m_1 = -m_2\). En effet, on a alors
\[\begin{align*} A(a, m) &= \begin{cases} +\frac{1}{2}, & \text{if } (n+m)\cdot a > 0,\\ -\frac{1}{2}, & \text{otherwise;} \end{cases}\\ B(b, m) &= \begin{cases} +\frac{1}{2}, & \text{if } (-n-m)\cdot b > 0,\\ -\frac{1}{2}, & \text{otherwise.} \end{cases}. \end{align*}\]Il est alors clair que \(P(a,-a) = -1\). CQFD.
Au final, le choix du formalisme quantique apparaît donc comme un choix métaphysique, selon que l’on préfère abandonner le réalisme ou non. Je dit bien “apparaît” car les théorème de Bell vont justement montrer qu’il n’en est rien: il y a des conséquences mesurables à choisir une théorie réaliste.
On considère maintenant deux réglages \(a\) et \(a'\) de l’appareil I et deux réglages \(b\) et \(b'\) de l’appareil II. Pour simplifier l’écriture, je ne vais plus faire figuré la dépendence en les réglages: \(A(\lambda)\) sera \(A(a, \lambda)\), \(A'(\lambda)\) sera \(A(a',\lambda)\), \(B(\lambda)\) sera \(B(b, \lambda)\) et \(B'(\lambda)\) sera \(B(b',\lambda)\). Nous allons démontré une inégalité due à Clauser, Horne, Shimony et Holt (1969), et donc appelée inégalité CHSH,
\[\underbrace{|P(a',b) - P(a,b) + P(a',b') + P(a,b')|}_{\displaystyle R(a, a', b, b')} \le 2\]quelques soient les réglages.
La démonstration est très simple. On commence par majorer la valeur absolue de l’intégrale par l’intégrale de la valeur absolue,
\[\begin{align} R(a, a', b, b') \le \int_\Lambda &\big|[A'(\lambda) - A(\lambda)] B(\lambda)\\ &+ [A'(\lambda) + A(\lambda)]B'(\lambda) \big| d\rho(\lambda). \end{align}\notag\]Comme \(A\) et \(A'\) prennent seulement les valeurs \(\pm 1\), ou bien \(A'(\lambda) \ne A(\lambda)\), auquel cas le premier crochet vaut \(\pm 2\) et le second crochet 0, ou bien \(A'(\lambda) = A(\lambda)\), auquel cas le premier crochet vaut 0 et le second crochet vaut \(\pm 2\). Comme \(B\) et \(B'\) ne prennent que les valeurs +1 et -1, dans les deux cas, l’intégrande est majoré par 2, ce qui finit la preuve puisque par définition d’une mesure de probabilité, \(\int_\Lambda d\rho(\lambda)=1\).
Un test expérimental consistera alors à mesurer
\[R(a,a',b,b') = D_N(a',b) - D_N(a,b) + D_N(a',b') + D_N(a,b')\]et à chercher des réglages \(a\), \(a'\), \(b\), \(b'\) des appareils de mesure tels que \(R(a,a',b,b')\) soit plus grand que 2 en valeur absolue. De telles expériences furent réalisées, et cette borne fut effectivement violée. La conclusion est donc que l’une ou l’autre des deux hypothèses de réalisme ou de localité est falsifiée. L’étape suivante est alors d’étudier les prédictions des théories qui ne contiennent pas ces hypothèses, et de comparer leur prédictions pour les bornes de \(R(a,a',b,b')\). En premier lieu, vient la mécanique quantique, pour laquelle les deux hypothèses sont fausses, mais il est aussi intéressant de chercher si il est possible de déveloper une théorie conservant l’une des deux.
Nous allons maintenant étudier la violation des inégalités de Bell prédite par la mécanique quantique.
Il faut trouver des réglages tels que la mécanique quantique prédise que \(R(a, a', b, b')\) soit plus grand que 2, et le plus grand possible afin d’augmenter le poids statistique du résultat. Pour cela, il me faut d’abord introduire la machinerie quantique. Je noterais \(\Hsingle\) l’espace de Hilbert des états non-corrélés de la particule 1 prise isolément, et comme les deux particules sont identiques, il s’agit aussi de l’espace de Hilbert pour la particule 2 prise isolément. Il s’agit bien sûr d’un espace de dimension 2. L’espace de Hilbert pour une paire est alors le produit tensoriel \(\Hpair=\Hsingle\otimes\Hsingle\). Ensuite, les observables \(A\), \(A'\), \(B\) et \(B'\) deviennent tout d’abord des opérateurs hermitiens de \(\Hsingle\) opérant sur la première particule pour les deux premiers, et la seconde particule pour les deux derniers, dans les deux cas sur une particule isolée. La propriété que les observables prennent seulement les valeurs \(\pm 1\) se traduit par le fait que les valeurs propres de \(A\), \(A'\), \(B\) et \(B'\) sont \(\pm 1\).
Ensuite, les observables \(AB\), \(A'B\), etc deviennent les produits tensoriels des opérateurs correspondants, \(A\otimes B\), \(A'\otimes B\), etc. Enfin, les espérances doivent maintenant s’entendre au sens quantique, i.e. pour tout opérator \(O\),
\[\expect{O} = \bra\psi O \ket\psi,\]où \(\ket\psi\) est l’état quantique dans lequelle toutes les paires sont préparées.
L’expression \(R(a, a', b, b')\) bornée par les inégalités de Bell s’écrit alors comme la valeur absolue
\[R(a, a', b, b') = \left| \expect{S} \right| \label{Rexpect}\]de l’espérance de l’opérateur
\[S = A'\otimes B - A\otimes B + A'\otimes B' + A\otimes B'.\]Ceci étant posé, le premier résultat important que:
L’espérance de \(S\) pour un ket séparable \(\ket\psi=\ket\phi\ket\xi\) ne viole pas les inégalités CHSH.
Dans ce cas,
\[\expect{S}=\left[\expect{A'} - \expect{A}\right]\expect{B} + \left[\expect{A'} + \expect{A}\right]\expect{B'}, \notag\]où les espérances sont pour \(\ket\phi\) dans le cas de \(A\) et \(A'\) et pour \(\ket\xi\) dans le cas de \(B\) et \(B'\). Le théorème résulte alors du lemme suivant.
{{Lemme 1}} Si \(u\), \(v\), \(x\), et \(y\) sont dans \([-1, 1]\), alors
\[-2 \le u(x-y)+v(x+y) \le 2.\]Posons \(X=(x+y)/2\) et \(Y=(x-y)/2\). Le domaine de \((x,y)\) devient pour \((X,Y)\):
\[\begin{align} &-1 < X + Y < 1,\\ &-1 < X - Y < 1, \end{align}\]Donc, du fait du domaine autorisé pour \(u\) et \(v\), si \(X \ge 0\) et \(Y \ge 0\), alors \(uX + vY \le X+Y \le 1\). De même, si \(X \ge 0\) et \(Y < 0\), alors \(uX + vY \le X-Y \le 1\). On finit en traitant de manière similaire toutes les possibilités restantes de signes de \(X\) et \(Y\).
CQFD.
Je vais avoir besoin d’un représentation simple et générale d’un état non-séparable de la paire: une décomposition de Schmidt. Tout ket \(\ket\psi\) peut se décomposer en
\[\ket\psi = c_1 \ket{\phi_1}\ket{\theta_1} + c_2 \ket{\phi_2}\ket{\theta_2},\notag\]où \(\mathcal{B}_1=(\ket{\phi_1}, \ket{\phi_2})\) et \(\mathcal{B}_2=(\ket{\theta_1}, \ket{\theta_2})\) sont deux bases orthonormées de \(\Hsingle\), et \(c_1\) et \(c_2\) sont deux nombres réels positifs. Ils doivent satisfaire \(c_1^2+c_2^2=1\) pour normaliser \(\ket\psi\), et donc il existe \(\varphi\in[0,\pi/2]\) tel que
\[\ket\psi = \cos\varphi \ket{\phi_1}\ket{\theta_1} + \sin\varphi \ket{\phi_2}\ket{\theta_2}.\]On peut maintenant établir la condition suivante.
En effet, si \(\ket\psi\) est séparable, alors
\[\ket\psi = \ket\xi\ket\eta,\]mais il existe alors des nombres complexes \(u_1\), \(u_2\), \(v_1\), et \(v_2\) tels que
\[\begin{align*} \ket\xi &= u_1\ket\phi_1 + u_2\ket\phi_2,\\ \ket\eta &= v_1\ket\theta_1 + v_2\ket\theta_2, \end{align*}\]et on a donc
\[\begin{align*} &\cos\varphi \ket{\phi_1}\ket{\theta_1} + \sin\varphi \ket{\phi_2}\ket{\theta_2} \\ &= u_1v_1\ket\phi_1 +u_2v_2\ket\phi_2\ket\theta_2 + u_1v_2\ket\phi_1\ket\theta_2 + u_2v_1\ket\phi_2\ket\theta_1. \end{align*}\]Par conséquent, \(u_1v_2=u_2v_1=0\) et donc \(\cos\varphi=u_1v_1=0\) ou \(\sin\varphi=u_2v_2=0\). À l’inverse, si \(\sin2\varphi=0\), alors \(\ket\psi=\ket{\phi_1}\ket{\theta_1}\) ou \(\ket{\phi_2}\ket{\theta_2}\). Ceci démontre le théorème par contraposée.
CQFD.
Je vais maintenant choisir les opérateurs suivants
\[\begin{align} &A = S_{1,x},\\ &A' = S_{1,z},\\ &B = S_{1,x}\sin b + S_{1,z}\cos b,\\ &B' = -S_{1,x}\sin b + S_{1,z}\cos b, \end{align}\label{pauliDecomposition}\]où \(S_{1,x}\) et \(S_{1,z}\) ont les matrices respectives \(\sigma_x\) et \(\sigma_z\) dans \(\mathcal{B}_1\) tandis que \(S_{2,x}\) et \(S_{2,z}\) ont les matrices respectives \(\sigma_x\) et \(\sigma_z\) dans \(\mathcal{B}_2\). Le protocole expérimental est typiquement le suivant: les particules s’éloignent de la source en directions opposées le long de l’axe des \(y\). On mesure alors la projection du spin de chacune dans une direction qui est dans le plan \(x-z\). Ceci pourrait être réalisé avec deux appareils de Stern et Gerlach.
En utilisant alors le fait que
\[\begin{align} \bra{\phi_i}\bra{\theta_i}S_{1,e}\otimes S_{2,f}\ket{\phi_j}\ket{\theta_j} &= \bra{\phi_i}S_{1,e}\ket{\phi_j}\bra{\theta_i}S_{2,f}\ket{\theta_j}\\&=\left(\sigma_e\right)_{ij}\left(\sigma_f\right)_{ij}, \end{align}\]on trouve facilement, en notant que les termes \(S_x\otimes S_z\) et \(S_z\otimes S_x\) donnent des contributions nulles, que
\[\begin{align*} \expect{A'\otimes B} &= \expect{A'\otimes B'} = \cos b,\\ \expect{A\otimes B} &= \sin2\varphi\sin b = -\expect{A\otimes B'}, \end{align*}\]et donc que
\[\expect{S} = 2\cos b(1 - \sin 2\varphi\tan b).\]En choisissant
\[\tan b = -\sin 2\varphi, \label{choice:of:b:for:max:violation}\]on a
\[\expect{S} = 2(1 + \sin^2 2\varphi)^\frac{1}{2},\]qui est en dehors de l’intervalle \([-2,2]\) pour toutes les valeurs de \(\varphi\in]0,\pi/2[\), c’est à dire pour toutes les kets non-séparables. Cette démonstration est un simplification dans un cas spécial simple de celle beaucoup plus générale de Gisin et Peres (1992).
Le dernier résultat de la section précédente montre que la valeur maximum de \(\expect{S}\) est égale à \(2\sqrt2\), obtenue pour \(\varphi=\pi/4\). On peut alors se demander si il est possible de faire mieux. La réponse est non. Cette borne supérieure fut démontré pour la première fois par Cirel'son (1980) – son nom est aussi orthographié Tsirelson parfois mais nous allons ici utiliser la démonstration de Braunstein, Mann et Revzen (1992).
Elle dépend du résultat suivant:
\[S^2 = 4I - \comm{A}{A'} \otimes \comm{B}{B'}. \label{Sfundamental}\]Nous allons en effet voir que cette propriété est pleine de conséquences pour les bornes de \(R(A,A',B,B')\) mais nous allons tout d’abord la démontrer. Tout d’abord, comme les opérateurs hermitiens \(A\), \(A'\), \(B\) et \(B'\) ont toute leur valeur propre égale à \(\pm 1\), nécessairement
\[A^2 = A'^2 = B^2 = B'^2 = I.\]Ensuite, dans les termes de \(S^2\), les multiplications de produits tensoriels deviennent des produits tensoriels de multiplications, dans lesquelles on peut alors éliminer tous ces carrés. Cela donne
\[\begin{split} S^2 &= I - A'\otimes A + B\otimes B' + A'A\otimes BB' \\ & -A\otimes A' + I - AA'\otimes BB' - B\otimes B' \\ & + B'\otimes B - A'A\otimes B'B + I + A'\otimes A \\ & + AA'\otimes B'B - B'\otimes B + A\otimes A' + I \\ \end{split}\]CQFD
Passons maintenant à l’exploitation de (\ref{Rexpect}) et (\ref{Sfundamental}). Comme un commutateur a une trace nulle, les valeurs propres de l’opérateur hermitien \(i \comm{A}{A'}\) sont \(\alpha\) et \(-\alpha\) pour un certain nombre réel \(\alpha \ge 0\). Soient \(\ket\alpha\) et \(\ket{-\alpha}\) les vecteurs propres associés. Avec le même raisonnement, les valeurs propres de \(i \comm{B}{B'}\) sont \(\beta\) et \(-\beta\) pour un certain nombre réel \(\beta \ge 0\) et les vecteurs propres associés seront notés \(\ket\beta\) et \(\ket{-\beta}\). Il est alors immédiat que \(S^2\) a deux valeurs propres dégénérées, \(4 + \alpha\beta\) et \(4 -\alpha\beta\), qui sont nécessairement positives puisque \(S^2\) est positif, et que les espaces propres associés sont respectivement \(\mathcal{U} = \Vec{\ket\alpha\ket\beta, \ket{-\alpha}\ket{-\beta}}\) et \(\mathcal{V} = \Vec{\ket{-\alpha}\ket\beta, \ket\alpha\ket{-\beta}}\). Par conséquent, les valeurs propres de \(S\) s’écrivent ou bien \(\pm\sqrt{4+\alpha\beta}\) ou bien \(\pm\sqrt{4-\alpha\beta}\). Les premières (resp. les secondes) ont leurs vecteurs propres dans \(U\) (resp. \(V\)).
On voit donc que si \(A\) commute avec \(A'\) ou bien si \(B\) commute avec \(B'\), les valeurs propres de \(S\) sont égales à \(\pm2\), et par conséquent \(R(A,A',B,B')\) est toujours entre -2 et 2: la borne de l’inégalité de Bell n’est violée pour aucun réglage et pour aucun état quantique de la paire \(\ket\psi\). Rappellons en effet que pour un opérateur hermitien tel que \(S\), la borne supérieure de l’espérance \(\bra\psi S\ket\psi\), quand \(\ket\psi\) décrit l’ensemble des kets tels que \(\braket{\psi}{\psi}=1\), est la plus grande des valeurs propres de \(S\).
Si au contraire aucune de ces paires d’opérateurs ne commute, alors \(\alpha\beta > 0\). Dans ce cas, les valeurs propres \(\pm\sqrt{4+\alpha\beta}\) sont en dehors de l’intervalle \([-2,2]\). Quelle violation maximale peut-on obtenir? Comme \(\matnorm{\comm{A}{A'}} \le 2 \matnorm{A} \matnorm{A'}\), nécessairement \(-2 \le \alpha \le 2\) puisque \(\matnorm{A}=\matnorm{A'}=1\). De même, \(-2 \le \beta \le 2\). Cela démontre que la borne maximale est \(2\sqrt{2}\) comme annoncé plus haut mais nous voyons aussi que cette borne est réalisée quand \(\alpha = \beta = \pm 2\).
Il est facile de voir que l’exemple étudié en section c rentre dans ce théorème. En effet, nous avons vu que la violation maximale est obtenue pour \(\varphi=\pi/4\), et donc avec l’équation (\ref{choice:of:b:for:max:violation}), on a \(b=-\pi/4\), et donc les équations (\ref{pauliDecomposition}) impliquent que \(\comm{A}{A'}\) et \(\comm{B}{B'}\) admettent comme matrice \(-2\sigma_y\) dans les bases respectives \(\mathcal{B}_1\) et \(\mathcal{B}_2\). Comme les valeurs propres de \(\sigma_y\) sont \(\pm 1\), CQFD.
Hensen, B., Bernien, H., Dreau, A. E., Reiserer, A., Kalb, N., Blok, M. S., Ruitenberg, J., Vermeulen, R. F. L., Schouten, R. N., Abellan, C., Amaya, W., Pruneri, V., Mitchell, M. W., Markham, M., Twitchen, D. J., Elkouss, D., Wehner, S., Taminiau, T. H., & Hanson, R. (2015). Loophole-free Bell inequality violation using electron spins separated by 1.3 kilometres. Nature, 526(7575), 682–686.
Einstein, A., Podolsky, B., & Rosen, N. (1935). Can Quantum-Mechanical Description of Physical Reality Be Considered Complete? Phys. Rev., 47, 777–780.
Bell, J. S. (1964). On the Einstein Podolsky Rosen paradox. Physics, 1(3), 195–200.
Mermin, N. D. (1993). Hidden variables and the two theorems of John Bell. Reviews of Modern Physics, 65(3), 803–815.
Clauser, J. F., Horne, M. A., Shimony, A., & Holt, R. A. (1969). Proposed Experiment to Test Local Hidden-Variable Theories. Phys. Rev. Lett., 23, 880–884.
Gisin, N., & Peres, A. (1992). Maximal violation of Bell’s inequality for arbitrarily large spin. Physics Letters A, 162(1), 15–17.
Cirel’son, B. S. (1980). Quantum generalizations of Bell’s inequality. Letters in Mathematical Physics, 4, 93–100.
Braunstein, S. L., Mann, A., & Revzen, M. (1992). Maximal violation of Bell inequalities for mixed states. Phys. Rev. Lett., 68, 3259–3261.