Matriskvantmekanik ( matrismekanik ) är en formulering av kvantmekanik skapad av Werner Heisenberg , Max Born och Pascual Jordan 1925. Matriskvantmekanik var den första konceptuellt autonoma och logiskt konsekventa formuleringen av kvantmekanik. Hennes beskrivning av kvanthopp ersatte Bohr-modellen för elektronbanor . Detta gjordes genom att tolka de fysikaliska egenskaperna hos partiklar som matriser som utvecklas över tiden. Matrismekanik är likvärdig med Schrödinger-vågformuleringen av kvantmekanik [1] , som den visas i Diracs bh- och ket-notation .
I motsats till vågformuleringen, i matrismekanik, erhålls spektra av operatorer (främst energi sådana) genom rent algebraiska metoder för stegoperatorer [2] . Baserat på dessa metoder erhöll Wolfgang Pauli spektrumet av väteatomen 1926 [3] före utvecklingen av vågmekaniken.
1925 formulerade Werner Heisenberg , Max Born och Pascual Jordan matriskvantmekanik [4] .
1925 arbetade Werner Heisenberg i Göttingen med problemet med att beräkna vätespektrallinjerna . I maj 1925 försökte han beskriva atomsystem endast i termer av observerbara . Den 7 juni, för att undvika effekterna av en akut hösnuva , åkte Heisenberg till den pollenfria ön Helgoland i Nordsjön . Medan han var där, mellan att klättra och memorera verser från Goethes West-East Divan , fortsatte han att spekulera i det spektrala problemet och insåg så småningom att om man antar att observerbara objekt som inte är pendlande kunde lösa problemet. Han skrev senare:
Klockan var ungefär tre på morgonen när det slutliga resultatet av beräkningen dök upp för mig. Först blev jag djupt chockad. Jag var så upprymd att jag inte kunde tänka på att sova. Så jag lämnade huset och väntade på soluppgången på toppen av klippan [5] .
Efter att Heisenberg återvänt till Göttingen visade han Wolfgang Pauli sina beräkningar och noterade en gång:
För mig är det fortfarande vagt och oklart, men det verkar som att elektronerna inte längre kommer att kretsa [6] .
Den 9 juli överlämnade Heisenberg samma tidning med sina beräkningar till Max Born, där han konstaterade att "han skrev en galen tidning och inte vågade skicka den för publicering, och att Born borde läsa den och ge honom råd" innan publiceringen. Heisenberg lämnade sedan kort och lämnade Born för att analysera tidningen [7] .
I artikeln formulerade Heisenberg en kvantteori utan tydliga elektronbanor. Hendrik Kramers hade tidigare beräknat de relativa intensiteterna för spektrallinjer i Sommerfeld-modellen och tolkat Fourier-koefficienterna för omloppsbanorna som intensiteter. Men hans svar, som alla andra beräkningar i den gamla kvantteorin , var bara sant för stora banor .
Heisenberg började efter att ha samarbetat med Kramers [8] inse att övergångssannolikheterna inte är helt klassiska storheter, eftersom Fourier-serien endast bör inkludera de frekvenser som observerats i kvanthopp, och inte de fiktiva som kommer från Fourier-analysen av exakta klassiska banor. Han ersatte den klassiska Fourier-serien med en koefficientmatris, en suddig kvantanalog av Fourier-serien. Klassiskt sett ger Fourier-koefficienterna intensiteten av den emitterade strålningen , så i kvantmekaniken var storleken på matriselementen hos koordinatoperatören intensiteten av strålningen i spektrumet av ljusa linjer. Storheterna i Heisenbergs formulering var den klassiska koordinaten och momentumet, men nu var de inte längre väldefinierade. Varje värde representerades av en uppsättning Fourier-koefficienter med två index som motsvarar de initiala och slutliga tillstånden [9] .
När Born läste tidningen insåg han att formuleringen kunde dechiffreras och utvidgas till det systematiska språket i matriser [10] , som han hade studerat under Jacob Rosanes [11] vid universitetet i Breslau . Born, med hjälp av sin assistent och tidigare elev Pascual Jordan, började genast analysera och utöka den, och de lämnade in sina resultat för publicering; tidningen mottogs för publicering endast 60 dagar efter Heisenbergs [12] papper .
Ett uppföljningsdokument lämnades in för publicering före årets slut av alla tre författarna [13] (En kort översikt över Borns roll i utvecklingen av matrismekanik, tillsammans med en diskussion om nyckelformeln som involverar icke-kommutativiteten av sannolikhetsamplituder , finns i Jeremy Bernsteins artikel [14] En detaljerad historisk och teknisk rapport finns i Mehra och Rechenbergs Historical Development of Quantum Theory, Volym 3. Formulering av Matrix Mechanics and Its Modifications 1925-1926 [15] )
Tre grundläggande artiklar:
Fram till den tiden använde fysiker sällan matriser; de ansågs tillhöra den rena matematikens rike. Gustav Mie använde dem i en uppsats om elektrodynamik 1912, och Born använde dem i sitt arbete med teorin om kristallgitter 1921. Även om matriser användes i dessa fall kom inte algebra av matriser med deras multiplikation in i bilden, som i matrisformuleringen av kvantmekaniken [16] .
Born lärde sig dock matrisalgebra från Rosanes, som noterat, men Born lärde sig även Hilberts teori om integralekvationer och kvadratiska former för ett oändligt antal variabler, vilket framgår av Borns citat från Hilberts Grundzüge einer allgemeinen Theorie der. Linearen Integralgleichungen utgiven 1912 [17] [18] .
Jordan var också väl förberedd för denna uppgift. Under ett antal år var han Richard Courants assistent i Göttingen under utarbetandet av Courant och David Hilberts Methods of Mathematical Physics I, som publicerades 1924 [19] . Denna bok innehöll lyckligtvis många matematiska verktyg som var nödvändiga för vidare utveckling kvantmekanik.
1926 blev John von Neumann David Hilberts assistent och myntade termen Hilbert space för att beskriva algebra och analys som användes i utvecklingen av kvantmekaniken [20] [21] .
Ett nyckelbidrag till denna formulering gjordes av Dirac 1925 i hans papper om omtolkning/syntes [22] , som uppfann språket och strukturen som vanligtvis används idag, vilket till fullo visar den icke-kommutativa strukturen av hela konstruktionen.
Innan matrismekanikens tillkomst beskrev den gamla kvantteorin rörelsen av en partikel längs en klassisk bana med en väldefinierad position och momentum X ( t ), P ( t ) med den begränsningen att integralen över tid över en period T av momentum gånger hastighet måste vara ett heltal en positiv multipel av Plancks konstant
.Även om denna begränsning korrekt väljer banor med mer eller mindre korrekta energivärden En , beskrev den gamla kvantmekaniska formalismen inte tidsberoende processer som emission eller absorption av strålning.
När en klassisk partikel är svagt kopplad till strålningsfältet, så att strålningsdämpningen kan försummas, kommer den att stråla ut i ett mönster som upprepar sig varje varvperiod . Frekvenserna som utgör den emitterade vågen är då multiplar av orbitalfrekvensen, och detta är en återspegling av det faktum att X ( t ) är periodisk, så dess Fourierrepresentation har bara frekvenser på 2π n/T.
.Koefficienterna för X n är komplexa tal . De med negativa frekvenser måste vara komplexa konjugat av kvantiteter med positiva frekvenser, så X ( t ) kommer alltid att vara verklig,
.Å andra sidan kan en kvantmekanisk partikel inte stråla kontinuerligt, den kan bara sända ut fotoner. Om vi antar att kvantpartikeln startade i bana nummer n , avgav en foton och sedan hamnade i bana nummer m , finner vi att fotonenergin är lika med energinivåskillnaden E n − E m , vilket betyder att dess frekvens är lika med till ( E n − E m )/ h .
För stora tal n och m , men för relativt små n − m , är dessa klassiska frekvenser enligt Bohr- korrespondensprincipen
.I formeln ovan är T den klassiska perioden för antingen n eller m , eftersom skillnaden mellan dem är av högre ordning i h . Men för små n och m , eller för stora n − m , är frekvenserna inte heltalsmultiplar av någon enskild frekvens.
Eftersom frekvenserna som emitteras av partikeln är desamma som frekvenserna i Fourierbeskrivningen av dess rörelse, ändras något i den tidsberoende beskrivningen av partikeln med frekvensen ( E n − E m )/ h . Heisenberg kallade denna storhet för X nm och krävde att den skulle reduceras till de klassiska Fourierkoefficienterna i den klassiska gränsen. För stora värden på n , m , men med relativt litet n − m , är X nm ( n − m ) - :e Fourierkoefficienten för den klassiska rörelsen i omloppsbana n . Eftersom X nm har en frekvens motsatt X mn , antar villkoret för att X ska vara reellt formen
.Per definition har X nm bara frekvens ( En − E m )/ h , så dess tidsutveckling är enkel :
.Detta är den ursprungliga formen av Heisenbergs rörelseekvation.
Givet två matriser X nm och P nm som beskriver två fysiska storheter, skulle Heisenberg kunna bilda en ny matris av samma typ genom att kombinera termerna X nk P km , som också svänger med den önskade frekvensen. Eftersom Fourierkoefficienterna för produkten av två kvantiteter är faltningar av Fourierkoefficienterna för var och en av dem separat, gjorde överensstämmelsen med Fourierserien det möjligt för Heisenberg att härleda en regel genom vilken produkten av matriser skulle beräknas
.Born påpekade att detta är lagen om matrismultiplikation , så att position, rörelsemängd, energi, alla observerbara storheter i teorin tolkas som matriser. Enligt denna regel beror produkten på matrisernas ordning: XP skiljer sig från PX .
X-matrisen är en komplett beskrivning av rörelsen hos en kvantmekanisk partikel. Eftersom frekvenserna i kvantrörelse inte är multipler av den gemensamma frekvensen, kan matriselementen inte tolkas som Fourier-koefficienterna för en exakt klassisk bana . Men både matriserna X ( t ) och P ( t ) uppfyller de klassiska rörelseekvationerna; se även Ehrenfests sats nedan.
När Werner Heisenberg, Max Born och Pascual Jordan introducerade matrismekanik 1925, accepterades det inte omedelbart och var initialt kontroversiellt. Schrödingers senare beskrivning av vågmekanik fick mer stöd.
En del av anledningen var att Heisenbergs formulering var på ett märkligt matematiskt språk för tiden, medan Schrödingers baserade sig på välbekanta vågekvationer. Men det fanns också ett djupare sociologiskt skäl. Kvantmekaniken utvecklades på två sätt: den ena leddes av Einstein, som betonade den våg-partikeldualitet han föreslog för fotoner, och den andra leddes av Bohr, som betonade de diskreta energitillstånden och kvanthoppen som upptäcktes av Bohr. De Broglie reproducerade diskreta energitillstånd inom Einsteins teori – ett kvanttillstånd är ett tillstånd av en stående våg, och detta gav anhängare av Einsteinskolan hoppet om att alla diskreta aspekter av kvantmekaniken skulle inkluderas i den kontinuerliga vågmekaniken.
Å andra sidan uppstod matrismekaniken från Bohr-skolan av diskreta energitillstånd och kvanthopp. Bohrs anhängare uppskattade inte de fysiska modellerna som avbildade elektroner som vågor eller något alls. De föredrog att fokusera på kvantiteter som var direkt relaterade till experiment.
Inom atomfysik har spektroskopi gett observationsdata om atomövergångar som uppstår när atomer interagerar med ljuskvanta . Bohrs anhängare krävde att endast de storheter skulle förekomma i teorin som i princip kunde mätas i spektroskopi. Dessa kvantiteter inkluderar energinivåerna och intensiteterna för spektrallinjerna, men inkluderar inte den exakta positionen för partikeln i dess Bohr-bana. Det är mycket svårt att föreställa sig ett experiment som skulle kunna avgöra om en elektron i grundtillståndet för en väteatom befinner sig till höger eller till vänster om kärnan. Det fanns en djup övertygelse om att det inte fanns några svar på sådana frågor.
Matrisformuleringen byggdes på premissen att alla fysiska observerbara objekt representeras av matriser vars element är indexerade av två olika energinivåer. I slutändan förstods uppsättningen av egenvärden för en matris som uppsättningen av alla möjliga värden som en observerbar kan ha. Eftersom Heisenberg-matriserna är hermitiska är egenvärdena reella.
Vid mätning av det observerbara blir resultatet ett visst egenvärde som motsvarar egenvektorn som representerar systemets tillstånd omedelbart efter mätningen. Mäthandlingen i matrismekanik "kollapser" systemets tillstånd. Om två observerbara mäts samtidigt, kollapsar systemets tillstånd till en gemensam egenvektor för de två observerbara. Eftersom de flesta matriser inte har gemensamma egenvektorer kan de flesta observerbara aldrig mätas exakt samtidigt. Detta är osäkerhetsprincipen .
Om två matriser har gemensamma egenvektorer kan de diagonaliseras samtidigt. I en grund där de båda är diagonala, beror deras produkt inte på deras ordning, eftersom multiplikationen av diagonala matriser helt enkelt är multiplikationen av tal. Osäkerhetsprincipen är däremot ett uttryck för att två matriser A och B ofta inte alltid pendlar, det vill säga att AB − BA inte nödvändigtvis är lika med 0. Matrismekanikens grundläggande kommuteringsrelation,
betyder att det inte finns några tillstånd som samtidigt har en viss position och momentum .
Denna osäkerhetsprincip gäller även för många andra observerbara par. Till exempel pendlar energin inte heller med koordinaten, så det är omöjligt att exakt bestämma positionen och energin för en elektron i en atom.
1928 nominerade Albert Einstein Heisenberg, Born och Jordan till Nobelpriset i fysik [23] . Tillkännagivandet av Nobelpriset i fysik för 1932 försenades till november 1933 [24] . Det var då som Heisenberg tillkännagavs ha fått priset 1932 "för skapandet av kvantmekanik, vars tillämpning bland annat ledde till upptäckten av de allotropa formerna av väte" [25] , och Erwin Schrödinger och Paul Adrien Maurice Dirac delade 1933 års pris "för upptäckten av nya produktiva former av atomteori" [25] .
Man kan undra varför Born inte tilldelades priset 1932 tillsammans med Heisenberg, och Bernstein spekulerar i detta. En av dem handlar om att Jordan gick med i nazistpartiet den 1 maj 1933 och blev stormtrooper [26] . Jordans partitillhörighet och Jordans band till Bourne kan mycket väl ha påverkat Bournes chanser att vinna priset vid den tiden. Bernstein noterar vidare att när Born äntligen fick priset 1954 levde Jordan fortfarande, och priset delades ut för en statistisk tolkning av kvantmekaniken som endast tillskrivs Born [27] .
Heisenbergs meddelande till Born of Heisenbergs pris 1932, och att Born fick priset 1954, är också lärorikt för att bedöma om Born ska dela priset med Heisenberg. Den 25 november 1933 fick Born ett brev från Heisenberg där han sa att han var sen med brevet på grund av "dåligt samvete" att han ensam fick priset "för det arbete som utförts i Göttingen i samarbete - du, Jordan och jag." Heisenberg fortsatte med att säga att Born och Jordans bidrag till kvantmekaniken inte kan ändras genom "fel beslut utifrån" [28] .
1954 skrev Heisenberg en artikel tillägnad Max Planck om hans insikt från 1900. I tidningen gav Heisenberg beröm till Born och Jordan för den slutliga matematiska formuleringen av matrismekanik, och sedan betonade Heisenberg hur stort deras bidrag till kvantmekaniken var, som "inte har fått vederbörligt erkännande i allmänhetens ögon" [29] .
När Heisenberg väl introducerade matriserna för X och P kunde han hitta deras matriselement i speciella fall genom gissningar, styrda av korrespondensprincipen . Eftersom matriselement är de kvantmekaniska motsvarigheterna till Fourier-koefficienterna för klassiska banor, är det enklaste fallet den harmoniska oscillatorn , där den klassiska koordinaten och rörelsemängden X ( t ) och P ( t ) är sinusformade.
I enheter där oscillatorns massa och frekvens är lika med ett (se icke-dimensionalisering ) är oscillatorns energi [30]
Nivåuppsättningen H är de medurs banorna, och de är kapslade cirklar i fasrummet. Den klassiska omloppsbanan med energi E är
Den gamla kvantteorin dikterar att integralen av P dX över omloppsbanan, som är arean av en cirkel i fasrymden, måste vara en heltalsmultipel av Plancks konstant . Arean av en cirkel med radien √ 2 E är 2 πE . Energi alltså
ges i naturliga enheter , där ħ = 1 är ett heltal.
Fourierkomponenterna för X ( t ) och P ( t ) förenklas, ännu mer om de kombineras till kvantiteter
.Båda storheterna A och A † har bara en frekvens, och X och P kan rekonstrueras från deras summa och skillnad.
Eftersom A ( t ) endast har den lägsta frekvensen i den klassiska Fourierserien och matriselementet A mn är den ( m − n ) :te Fourierkoefficienten för den klassiska banan, är matrisen för A endast noll vid positioner ovanför diagonalen, där den tar värdena √2 E n . Matrisen för A † är också icke-noll endast vid positioner under diagonalen med samma poster.
Från A och A † kan man alltså skriva uttryck för koordinaten
och momentum
som, upp till en faktor, är Heisenberg-matriserna för den harmoniska oscillatorn. Båda matriserna är hermitiska , eftersom de är byggda från Fourier-koefficienterna för verkliga värden.
Sökandet efter tidsberoendet av X ( t ) och P ( t ) är förenklat eftersom de är kvant-fourierkoefficienter, så deras utveckling över tiden beskrivs av uttrycken
Produkten av matriserna X och P är inte en hermitisk matris, utan har verkliga och imaginära delar. Den reella delen är hälften av det symmetriska uttrycket XP + PX , och den imaginära delen är proportionell mot kommutatorn
.Det kan verifieras genom direkt substitution att XP − PX i fallet med en harmonisk oscillator är lika med iħ multiplicerat med ett .
På samma sätt är det lätt att kontrollera att matrisen
diagonal med egenvärden E i .
Kvantbeskrivningen av en harmonisk oscillator är ett viktigt praktiskt exempel. Det är lättare att hitta matriser än att fastställa de allmänna villkoren för dessa specialformer. Av denna anledning undersökte Heisenberg den anharmoniska oscillatorn med Hamiltonian
I ett sådant fall är X och P inte längre enkla off-diagonala matriser, eftersom de motsvarande klassiska banorna är något komprimerade och förskjutna så att de har Fourier-koefficienter vid varje klassisk frekvens. För att definiera matriselementen krävde Heisenberg att de klassiska rörelseekvationerna lydde matrisekvationerna:
Han märkte att om detta kunde göras så skulle H , betraktad som en matrisfunktion av X och P , ha noll tidsderivata.
där A∗B är antikommutatorn ,
.Med tanke på att alla off-diagonala element har en frekvens som inte är noll; konstanten H betyder att H är diagonal. Heisenberg insåg att i detta system kunde energi bevaras exakt i ett godtyckligt kvantsystem, vilket var ett mycket uppmuntrande tecken.
Processen med emission och absorption av fotoner verkade kräva att lagen om bevarande av energi i bästa fall fungerade i genomsnitt. Om en våg som innehåller exakt en foton passerar genom flera atomer och en av dem absorberar den, då måste den atomen berätta för de andra att de inte längre kan absorbera fotonen. Men om atomerna är långt ifrån varandra, kan vilken signal som helst inte nå andra atomer i tid, och de kan absorbera samma foton ändå och sprida energi i miljön. När signalen når dem måste de andra atomerna återföra den energin på något sätt . Denna paradox fick Bohr, Kramers och Slater att överge det exakta bevarandet av energi. Heisenbergs formalism, utsträckt till det elektromagnetiska fältet, avsåg tydligt att kringgå detta problem genom att antyda att tolkningen av teorin skulle inkludera kollaps av vågfunktioner .
Kravet på att bevara de klassiska rörelseekvationerna är inte ett tillräckligt starkt villkor för definitionen av matriselement. Eftersom Plancks konstant inte förekommer i de klassiska ekvationerna, kan matriser konstrueras för många olika värden av ħ och fortfarande tillfredsställa rörelseekvationerna, men med olika energinivåer.
Så för att implementera sitt program var Heisenberg tvungen att använda det gamla kvantvillkoret för att fixera energinivåerna, sedan fylla i matriserna med Fourier-koefficienterna för de klassiska ekvationerna och sedan ändra matriskoefficienterna och energinivåerna något för att säkerställa de klassiska ekvationerna håll. Detta tillvägagångssätt passar inte, eftersom de gamla kvantförhållandena hänvisar till en region begränsad av exakta klassiska banor, som inte finns i den nya formalismen.
Viktigast av allt, Heisenberg upptäckte ett sätt att översätta det gamla kvanttillståndet till ett enkelt uttalande av matrismekanik.
För att göra detta studerade han handlingsintegralen som en matriskvantitet,
Det finns flera problem med denna integral, som alla härrör från matrisformalismens oförenlighet med den gamla bilden av banor. Vilken period T ska användas? Semiklassiskt bör detta vara antingen m eller n , men skillnaden matchar i ordningen ħ , och svaret söks i samma precisionsordning i ħ . Kvantvillkoret säger oss att J mn är 2π n diagonalt, så det faktum att J är klassiskt konstant säger oss att de off-diagonala elementen är noll.
Hans avgörande upptäckt var att differentiera kvanttillståndet med avseende på n . Denna idé ger full mening endast i den klassiska gränsen, där n inte är ett heltal utan en kontinuerlig handlingsvariabel J , men Heisenberg gjorde liknande manipulationer med matriser, där mellanuttryck ibland är diskreta skillnader och ibland derivator.
I det följande, för tydlighetens skull, kommer differentiering att utföras med avseende på klassiska variabler, och övergången till matrismekanik kommer att utföras efter den, styrd av korrespondensprincipen.
I den klassiska miljön är derivatan den totala derivatan med avseende på J av integralen som definierar J , så det är exakt 1.
där derivatorna dP/dJ och dX/dJ ska tolkas som skillnader i J vid motsvarande tidpunkter i nära banor, vilket kan erhållas genom att differentiera Fourier-koefficienterna för omloppsrörelsen. (Dessa derivator är symplektiskt ortogonala i fasutrymme till tidsderivatorna dP/dt och dX/dt ).
Det slutliga uttrycket förfinas genom att introducera en variabel kanoniskt konjugerad till J , kallad vinkelvariabeln θ : Tidsderivatan är derivatan med avseende på θ upp till en faktor på 2π T ,
Kvantintegralen för tillståndet är alltså medelvärdet över en cykel av Poisson-fästet X och P.
En liknande differentiering av Fourier-serien av funktionen PdX visar att alla off-diagonala element i Poisson-konsolen är lika med noll. Poisson-parentesen för två kanoniskt konjugerade variabler som X och P har ett konstant värde på 1, så denna integral är verkligen medelvärdet av 1; så det är 1, som vi har vetat hela tiden, eftersom det trots allt är dJ/dJ. Men Heisenberg, Born och Jordan var, till skillnad från Dirac, inte bekanta med teorin om Poisson-parenteser, så för dem utvärderade differentiering effektivt { X, P } i koordinaterna J, θ.
Poisson-fästet, till skillnad från handlingsintegralen, har ett enkelt sätt att översätta till matrismekanik - det motsvarar vanligtvis den imaginära delen av produkten av två variabler, kommutatorn .
För att se detta måste man undersöka den (antisymmetriserade) produkten av två matriser A och B i matchningsgränsen, där matriselementen är långsamt varierande funktioner av indexet, med tanke på att i det klassiska fallet är svaret noll.
I korrespondensgränsen, när indexen m , n är stora och nära, och k , r är små, är förändringshastigheten för matriselement i diagonal riktning matriselementet för J -derivatan av motsvarande klassiska storhet. Således är det möjligt att flytta vilket element som helst i matrisen diagonalt med hjälp av korrespondensen,
där den högra sidan faktiskt bara är ( m - n ):e Fourier-komponenten av dA/dJ på en bana nära m upp till denna semiklassiska ordning, och inte en fullständig väldefinierad matris.
Den semiklassiska tidsderivatan av matriselementet erhålls upp till en faktor i genom att multiplicera med avståndet från diagonalen,
eftersom koefficienten A m(m+k) är semiklassiskt den k':te Fourierkoefficienten för den m -: te klassiska omloppsbanan.
Den imaginära delen av produkten av A och B kan uppskattas genom att förskjuta matriselementen på ett sådant sätt att det klassiska svaret, som är noll, återges.
Sedan bestäms den inledande resten som inte är noll helt av skiftet. Eftersom alla matriselement befinner sig vid index som är ett kort avstånd från positionen för det stora indexet ( m, m ), är det användbart att införa två temporära notationer: A [ r,k ] = A (m+r)(m+ k) för matriser och ( dA/dJ )[ r ] för de r:te Fourierkomponenterna av klassiska storheter,
Genom att ändra summeringsvariabeln i den första summan från r till r' = k - r , blir matriselementet,
och detta visar att den huvudsakliga (klassiska) delen är reducerad.
Den högsta kvantdelen, om vi försummar produkten av högre ordningens derivator i resten, alltså
så till slut
som kan identifieras med i multiplicerat med den k: te klassiska Fourier-komponenten i Poisson-parentesen.
Heisenbergs ursprungliga trick med differentiering utökades så småningom till en fullständig semiklassisk härledning av kvanttillståndet i samarbete med Born och Jordan. En gång lyckades de slå fast det
,detta villkor ersatte och utökade den gamla kvantiseringsregeln, vilket gjorde att matriselementen P och X kunde bestämmas för ett godtyckligt system helt enkelt med formen av Hamiltonian.
Den nya kvantiseringsregeln antogs vara universellt sann , även om härledningen från den gamla kvantteorin krävde semiklassiska resonemang. (Men en fullständig kvantbehandling för mer komplexa parentesargument uppskattades på 1940-talet som en förlängning av Poisson- parenteser till Moyale-parenteser .)
För att göra övergången till standardkvantmekanik var det viktigaste ytterligare tillägget kvanttillståndsvektorn , nu betecknad med | ψ ⟩ är en vektor som påverkas av matriser. Utan en tillståndsvektor är det inte klart exakt vilken rörelse Heisenberg-matriserna beskriver, eftersom de inkluderar alla rörelser någonstans.
Tolkningen av tillståndsvektorn, vars komponenter skrivs som ψ m , gavs av Born. Denna tolkning är statistisk: resultatet av att mäta den fysiska storheten som motsvarar matrisen A är en slumpvariabel med ett medelvärde lika med
Alternativt och ekvivalent ger tillståndsvektorn sannolikhetsamplituden ψ n för att ett kvantsystem ska vara i ett energitillstånd n .
När väl tillståndsvektorn introducerades kunde matrismekaniken roteras till vilken bas som helst där H -matrisen inte längre behövde vara diagonal. Heisenbergs rörelseekvation i sin ursprungliga form säger att A mn utvecklas i tiden som Fourier-komponenten,
som kan omvandlas till differentiell form
och detta kan omformuleras till att vara sant på godtycklig basis genom att notera att H är diagonal med diagonala värden på E m ,
Nu är detta en matrisekvation som håller i vilken grund som helst. Detta är den moderna formen av Heisenbergs rörelseekvation.
Dess formella lösning är:
Alla dessa former av rörelseekvationen ovan säger samma sak, att A ( t ) är ekvivalent med A (0) via en basrotation av en enhetlig matris e iHt , en systematisk bild belyst av Dirac i hans Bra och ket-notation .
Omvänt, genom att rotera basen för tillståndsvektorn vid varje tidpunkt med eiHt , kan man eliminera beroendet av matriserna i tid. Matriserna är nu oberoende av tid, men tillståndsvektorn roterar,
Detta är Schrödinger-ekvationen för tillståndsvektorn, och denna tidsberoende förändring av bas är ekvivalent med en transformation till Schrödinger-representationen med 〈x | ψ ⟩ = ψ(x) .
Inom kvantmekaniken, i Heisenberg-representationen, tillståndsvektorn | ψ ⟩ förändras inte med tiden, och det observerbara A uppfyller Heisenbergs rörelseekvation ,
|
som har ett explicit tidsmässigt beroende , förutom ett tidsmässigt beroende av enhetlig evolution.
Heisenberg - representationen skiljer inte tid från rum, så den lämpar sig bättre för relativistiska teorier än Schrödinger-ekvationen. Dessutom är likheten med klassisk fysik mer uppenbar: Hamiltons rörelseekvationer för klassisk mekanik återställs genom att ersätta kommutatorn ovan med en Poisson-parentes (se även nedan). Enligt Stone-von Neumann-satsen måste Heisenberg-representationen och Schrödinger-representationen vara enhetligt ekvivalenta, som beskrivs i detalj nedan.
Matrismekaniken utvecklades snabbt till modern kvantmekanik och gav initiala fysikaliska resultat på atomernas spektra.
Jordan noterade att kommuteringsrelationerna säkerställer att P fungerar som en differentialoperatör .
Förhållande för operatörer
tillåter beräkning av kommutatorn P med valfri effekt av X , och detta betyder att
vilket tillsammans med linjäritet betyder att P -kommutatorn effektivt differentierar vilken analytisk matrisfunktion X som helst.
Förutsatt att gränserna är rimligt definierade, sträcker sig detta till godtyckliga funktioner - men förlängningen behöver inte göras explicit om inte en viss grad av matematisk rigor krävs.
|
I en grund där X är diagonal kan ett godtyckligt tillstånd skrivas som en överlagring av tillstånd med egenvärden x eller
,så ψ (x) = ⟨x | ψ ⟩ och operatorn X multiplicerar varje egenvektor med x ,
Vi definierar en linjär operator D som differentierar ψ ,
,och notera det
,så att operatorn − iD följer samma kommuteringsrelation som P . Således måste skillnaden mellan P och − iD pendla med X ,
,så det kan diagonaliseras samtidigt med X : dess värde som verkar på valfritt egentillstånd för X är någon funktion f av egenvärdet för x .
Denna funktion måste vara verklig eftersom både P och − iD är hermitiska,
,vrida varje tillstånd med f ( x ) , d.v.s. omdefiniera fasen för vågfunktionen:
.iD- satsen ändras av:
,vilket betyder att i den roterade basen är P lika med − iD .
Därför finns det alltid en grund för egenvärdena för X där verkan av P på någon vågfunktion är känd:
,och Hamiltonian i denna bas är en linjär differentialoperator som verkar på komponenterna i tillståndsvektorn,
Således är rörelseekvationen för tillståndsvektorn inget annat än den välkända differentialekvationen
|
För att göra denna härledning rigorös krävs en rimlig diskussion om funktioners gränsutrymme, och i detta utrymme finns Stone–von Neumann-satsen : alla operatorer X och P som följer kommuteringsrelationerna kan agera på vågfunktionernas rymd, med P vara differentieringsoperatören. Det betyder att Schrödinger-representationen alltid är tillgänglig.
Matrismekaniken kan naturligtvis lätt utökas till flera frihetsgrader. Varje frihetsgrad har en separat operator X och en separat effektiv differentialoperator P , och vågfunktionen är en funktion av alla möjliga egenvärden för de oberoende pendlingsvariablerna X.
I synnerhet betyder detta att ett system av N interagerande partiklar i 3 dimensioner beskrivs av en enda vektor vars komponenter i en bas där alla X är diagonala är en funktion i 3 N -dimensionell rymd som beskriver alla deras möjliga positioner , i praktiken mycket större uppsättning värden än bara en uppsättning N 3D-vågfunktioner i ett fysiskt utrymme. Schrödinger kom självständigt till samma slutsats och bevisade så småningom sin egen formalisms likvärdighet med Heisenbergs.
Eftersom vågfunktionen är en egenskap hos hela systemet, och inte för någon del av det, är beskrivningen inom kvantmekaniken inte helt lokal. I beskrivningen av flera kvantpartiklar är de korrelerade eller intrasslade . Denna förveckling leder till viktiga korrelationer mellan avlägsna partiklar som bryter mot den klassiska Bells ojämlikhet .
Även om partiklar bara kan vara i två koordinater, krävs 2N komplexa tal för att definiera vågfunktionen för N partiklar , en för varje gemensam koordinatkonfiguration. Detta är ett exponentiellt stort antal, så att simulera kvantmekanik på en dator kräver exponentiella resurser. Omvänt antyder detta att det är möjligt att hitta N -stora kvantsystem som fysiskt beräknar svar på problem som normalt skulle kräva 2N bitar av en klassisk dator för att lösa. Denna observation är kärnan i kvantberäkningen .
För tidsoberoende operatorer X och P ∂ A /∂ t = 0 , reduceras ovanstående Heisenberg-ekvation till [31] :
,där hakparenteser [*, *] anger kommutatorn. För Hamiltonian uppfyller operatorerna X och P ekvationerna:
,där den första är klassisk hastighet och den andra är klassisk kraft eller potentiell gradient . De återger Hamiltons form av Newtons rörelselagar . I Heisenberg-bilden uppfyller operatorerna X och P de klassiska rörelseekvationerna. Du kan ta det förväntade värdet på båda sidor av ekvationen för att se vad som finns i vilket tillstånd som helst | ψ⟩ :
Således följer de förväntade värdena för operatörer i en given stat exakt Newtons lagar. Detta är Ehrenfests sats , som är en uppenbar konsekvens av Heisenbergs rörelseekvationer, men är mindre trivial i Schrödinger-målningen där Ehrenfest upptäckte den.
Inom klassisk mekanik är den kanoniska transformationen av fasrumskoordinater en transformation som bevarar strukturen hos Poisson-parenteser. De nya variablerna x', p' är kopplade till varandra med samma Poisson-parenteser som de ursprungliga variablerna x, p . Tidsutveckling är en kanonisk transformation, eftersom fasrum när som helst är ett lika bra val av variabler som fasrum vid någon annan tidpunkt.
Hamiltonflödet är en kanonisk transformation av formen:
Eftersom Hamiltonian är en godtycklig funktion av x och p , finns det sådana oändliga kanoniska transformationer som motsvarar varje klassisk storhet G , där G fungerar som Hamiltonian för att skapa en ström av punkter i fasrummet i ett tidssteg s ,
För den allmänna formen av funktionen A ( x , p ) i fasrummet är dess oändliga förändring vid varje steg ds under denna mappning
Storheten G kallas den infinitesimala generatorn för den kanoniska transformationen.
Inom kvantmekaniken finns det en analog till G , som är en hermitisk matris, och rörelseekvationerna ges av kommutatorer,
Oändligt små kanoniska rörelser kan formellt integreras på samma sätt som Heisenbergs rörelseekvationer integrerades:
där U = e iGs s är en godtycklig parameter.
Således är definitionen av en kvantkanonisk transformation en godtycklig enhetlig förändring av basen i utrymmet för alla tillståndsvektorer. U är en godtycklig enhetlig matris som definierar en komplex rotation i fasrummet,
Dessa transformationer lämnar summan av kvadraterna av de absoluta värdena för komponenterna i vågfunktionen invariant, medan de omvandlar tillstånd som är multipler av varandra (inklusive tillstånd som multipliceras med imaginära tal) till tillstånd med samma multipliciteter.
Tolkningen av matriserna är att de fungerar som rörelsegeneratorer i tillståndsrummet .
Till exempel, rörelsen P skapar kan hittas genom att lösa Heisenbergs rörelseekvation med P som Hamiltonian,
Dessa är översättningar av matrisen X till en multipel av identitetsmatrisen,
Detta är tolkningen av derivatoperatorn D : e iPs = e D , den exponentiella derivatoperatorn är ett skift ( lagrangeskiftsoperatorn) .
X -operatören genererar också översättningar till P . Hamiltonian genererar translationer i tid , rörelsemängd genererar rotationer i det fysiska rummet , och operatorn X 2 + P 2 genererar rotationer i fasrymden .
När en transformation, som en rotation i det fysiska rummet, pendlar med en Hamiltonian, kallas denna transformation en Hamiltonian symmetri - Hamiltonianen som ges i roterade koordinater är densamma som den ursprungliga Hamiltonian. Detta betyder att förändringen i Hamiltonian under verkan av generatorn av infinitesimal symmetri L försvinner,
Det följer att förändringen i generatorn under tidsöversättning också försvinner,
så matrisen L är konstant i tiden – det vill säga den är bevarad.
En-till-en-överensstämmelsen mellan generatorer av infinitesimal symmetri och bevarandelagar upptäcktes av Emmy Noether för klassisk mekanik, där Poisson-parenteser är kommutatorerna , men det kvantmekaniska resonemanget är identiskt. Inom kvantmekaniken leder varje transformation av enhetssymmetri till en bevarandelag, för om matrisen U har egenskapen att
därav följer det
och därmed är tidsderivatan av U noll – den är bevarad.
Egenvärdena för enhetsmatriser är rena faser, så att värdet av en enhetlig bevarad kvantitet är ett komplext antal av enhetsstorlek, inte ett reellt tal. Ett annat sätt att uttrycka det är att den enhetliga matrisen är exponenten för i gånger den hermitiska matrisen, så att den additivt konserverade reella kvantiteten, fasen, bara är exakt definierad upp till en heltalsmultipel av 2π . Först när den enhetliga symmetrimatrisen är en del av en familj, godtyckligt nära identiteten, är de bevarade verkliga kvantiteterna ensvärda, och då blir kravet på deras bevarande en mycket starkare begränsning.
Symmetrier som kontinuerligt kan relateras till identitetsmatrisen kallas kontinuerlig , och translationer, rotationer och förstärkningar är exempel på sådana symmetrier. Symmetrier som inte kontinuerligt kan relateras till identitetsmatrisen är diskreta , och exempel är rumslig inversion eller paritetsoperation och laddningskonjugering .
Tolkningen av matriser som generatorer av kanoniska transformationer tillhör Paul Dirac [32] . Eugene Wigner visade att överensstämmelsen mellan symmetrier och matriser är fullständig om man inkluderar antiunitära matriser som beskriver symmetrier som involverar tidsomkastning.
Det var tydligt för Heisenberg från fysikaliska överväganden att kvadraterna av de absoluta värdena för matriselementen X , som är Fourier-koefficienterna för svängningarna, skulle ge emissionshastigheten för elektromagnetisk strålning.
I den klassiska gränsen för stor omloppsbana, om en laddning med koordinat X ( t ) och laddning q oscillerar nära en lika och motsatt laddning vid origo, är det momentana dipolmomentet qX ( t ) , och förändringen i detta ögonblick översätts direkt in i rumtiden förändring i vektorpotentialen, vilket ger källan till utgående sfäriska vågor.
För atomer är våglängden på det emitterade ljuset cirka 10 000 gånger atomradien och dipolmomentet är det enda bidraget till strålningen, medan alla andra detaljer i atomladdningsfördelningen kan försummas.
Utan att ta hänsyn till bakslaget är effekten som utstrålas i varje utgående läge summan av de individuella bidragen från kvadraten av varje oberoende tid Fouriermod d ,
Här, i Heisenberg-representationen, är Fourierkoefficienterna för dipolmomentet matriselementen för X. Denna överensstämmelse gjorde det möjligt för Heisenberg att införa en regel för övergångsintensiteterna, den del av tiden under vilken, med början från det initiala tillståndet i , en foton emitteras och atomen övergår till det slutliga tillståndet j ,
Detta möjliggjorde sedan en statistisk tolkning av storleken på matriselementen: de ger intensiteten av spektrallinjerna, sannolikheten för kvanthopp från utsläpp av dipolstrålning .
Eftersom övergångshastigheterna ges av matriselementen X , bör motsvarande övergång vara frånvarande i fall där Xij är lika med noll. De har kallats urvalsregler , som var ett mysterium innan matrismekanikens tillkomst.
Ett godtyckligt tillstånd för väteatomen utan att ta hänsyn till spinnet betecknas med symbolen | n _ ℓ,m ⟩, där värdet ℓ är ett mått på den totala omloppsrörelsemängden och m är dess z- komponent, som bestämmer orienteringen av banan. Komponenterna i pseudovektorn av rörelsemängd är
där produkterna i detta uttryck inte beror på faktorernas ordning och är verkliga eftersom de olika komponenterna i X och P pendlar.
Kommuteringsrelationer L med alla tre koordinatmatriserna X, Y, Z (eller med vilken vektor som helst) kan lätt hittas med formeln,
,där operatorn L genererar rotationer mellan de tre komponenterna i vektorn av koordinatmatriser X .
Härifrån kan vi betrakta kommutatorn Lz och koordinatmatriserna X, Y, Z,
, .Detta betyder att storheterna X + iY , X − iY följer enkla kommuteringsregler,
, .Liksom matriselementen X + iP och X − iP för den harmoniska oscillatorn Hamiltonian, innebär denna kommuteringslag att dessa operatorer endast har några off-diagonala matriselement i tillstånd med en viss m ,
och matrisen ( X + iY ) mappar egenvektorn Lz med egenvärde m till egenvektorn med egenvärde m + 1. På liknande sätt reducerar ( X − iY ) m med ett, medan Z inte ändrar värdet på m .
Så, i grunden | ℓ,m ⟩ anger där L 2 och L z har vissa värden, matriselementen för någon av de tre koordinatkomponenterna är lika med noll, förutom när m är lika eller ändras med ett.
Detta medför en begränsning av förändringen i det totala vinkelmomentet. Vilket tillstånd som helst kan roteras så att dess rörelsemängd blir så stor som möjligt i z- riktningen , där m = ℓ. Matriselement för koordinaten som verkar på | ℓ,m ⟩ kan bara ge m värden större än ett, så om koordinaterna roteras så att sluttillståndet är | ℓ',ℓ' ⟩, värdet ℓ' kan vara högst ett större än det största värdet ℓ som förekommer i initialtillståndet. Således är ℓ' som mest ℓ + 1.
Matriselementen försvinner vid ℓ' > ℓ + 1, och det inversa matriselementet bestäms av dess Hermiticitet, så de försvinner också vid ℓ' < ℓ — 1: dipolövergångar är förbjudna med en förändring av rörelsemängden med mer än en .
Heisenbergs rörelseekvation definierar matriselementen P i Heisenbergbasen bestående av matriselementen X .
,som gör den diagonala delen av kommuteringsrelationen (spår) till en summaregel för storleken på matriselement:
.Detta ger en relation för summan av de spektroskopiska linjeintensiteterna för övergångar till och från ett givet tillstånd, även om för att vara absolut korrekt måste bidrag från strålningsfångningssannolikheten för obundna spridningstillstånd inkluderas i denna summa:
.