Markov kedja

Den aktuella versionen av sidan har ännu inte granskats av erfarna bidragsgivare och kan skilja sig väsentligt från versionen som granskades den 28 december 2019; kontroller kräver 9 redigeringar .

En Markov-kedja  är en sekvens av slumpmässiga händelser med ett ändligt eller räknebart antal utfall , där sannolikheten för att varje händelse inträffar endast beror på tillståndet som nåddes i föregående händelse [1] . Den kännetecknas av egenskapen att löst uttryckt, med en fast nutid, är framtiden oberoende av det förflutna. Namngiven för att hedra A. A. Markov (senior) , som först introducerade detta koncept i arbetet 1906. [2]

Diskret-tid Markov kedja

Definition

En sekvens av diskreta slumpvariabler kallas en enkel Markov-kedja (med diskret tid) if

.

Således, i det enklaste fallet, beror den villkorliga fördelningen av nästa tillstånd av Markov-kedjan endast på det aktuella tillståndet och beror inte på alla tidigare tillstånd (till skillnad från högre ordningens Markov-kedjor).

Omfånget av slumpvariabler kallas kedjans tillståndsutrymme , och talet  är stegnumret.

Övergångsmatris och homogena kedjor

Matrix , var

kallas matrisen av övergångssannolikheter i det -e steget, och vektorn , där

— Den första distributionen av Markov-kedjan.

Uppenbarligen är övergångssannolikhetsmatrisen rätt stokastisk , dvs.

.

En Markovkedja kallas homogen om övergångssannolikhetsmatrisen inte beror på stegnumret, dvs.

.

Annars kallas Markov-kedjan inhomogen. I det följande kommer vi att anta att vi har att göra med homogena Markov-kedjor.

Finita dimensionella fördelningar och n-stegs övergångsmatrisen

Från egenskaperna för betingad sannolikhet och definitionen av en homogen Markov-kedja får vi:

,

varav specialfallet med Kolmogorov-Chapman-ekvationen följer:

,

det vill säga matrisen av övergångssannolikheter per steg i en homogen Markov-kedja är den -e graden av matrisen av övergångssannolikheter per 1 steg. Till sist,

.

Tillståndstyper

Exempel

Markovkedja med kontinuerlig tid

Definition

En familj av diskreta slumpvariabler kallas en Markov-kedja (med kontinuerlig tid) if

.

En Markovkedja med kontinuerlig tid sägs vara homogen if

.

Matrisen av övergångsfunktioner och Kolmogorov-Chapman-ekvationen

Liksom i fallet med diskret tid, bestäms de finita dimensionella fördelningarna av en kontinuerlig tidshomogen Markov-kedja helt av den initiala fördelningen

och matrisen av övergångsfunktioner ( övergångssannolikheter )

.

Matrisen av övergångssannolikheter uppfyller Kolmogorov-Chapmans ekvation : eller

Intensitetsmatrisen och Kolmogorovs differentialekvationer

Per definition är intensitetsmatrisen , eller motsvarande,

.

Två ekvationer följer från Kolmogorov-Chapmans ekvation:

För båda ekvationerna väljs initialvillkoret . Lämplig lösning

Egenskaper för matriserna P och Q

För varje matris har följande egenskaper:

  1. Matriselement är icke-negativa: (icke-negativitet av sannolikheter).
  2. Summan av elementen i varje rad är 1: (full sannolikhet), det vill säga matrisen är högerstokastisk (eller radvis).
  3. Alla matrisegenvärden överstiger inte 1 i absolut värde: . Om , då .
  4. Matrisens egenvärde motsvarar minst en icke-negativ vänster egenvektor - rad (jämvikt): .
  5. För ett egenvärde för en matris är alla rotvektorer egenvektorer, det vill säga att motsvarande Jordan-celler är triviala.

Matrisen har följande egenskaper:

  1. Off- diagonala matriselement är icke-negativa: .
  2. Diagonala matriselement är icke-positiva: .
  3. Summan av elementen i varje rad är 0:
  4. Den reella delen av alla matrisegenvärden är icke-positiv: . Om , då
  5. Matrisens egenvärde motsvarar minst en icke-negativ egenvektor på vänster rad (jämvikt):
  6. För ett egenvärde för en matris är alla rotvektorer egenvektorer, det vill säga att motsvarande Jordan-celler är triviala.

Övergångsdiagram, anslutningsmöjligheter och ergodiska Markov-kedjor

För en Markov-kedja med kontinuerlig tid är en riktad övergångsgraf (kortfattat en övergångsgraf) konstruerad enligt följande regler:

De topologiska egenskaperna hos övergångsgrafen är relaterade till matrisens spektrala egenskaper . I synnerhet gäller följande satser för ändliga Markov-kedjor:

S. För två olika hörn av övergångsgrafen finns det en sådan vertex på grafen ("common drain") att det finns orienterade banor från vertex till vertex och från vertex till vertex . Obs : möjligt fall eller ; i detta fall anses en trivial (tom) väg från till eller från till också vara en riktad väg. B. Ett nollegenvärde för en matris är icke degenererat. C. För , matrisen tenderar till en matris där alla rader sammanfaller (och, uppenbarligen, sammanfaller med jämviktsfördelningen). A. Övergångsdiagrammet för en kedja är riktningsförbundet. B. Nollegenvärdet för en matris är icke degenererat och motsvarar en strikt positiv vänsteregenvektor (jämviktsfördelning). B. För vissa är matrisen strikt positiv (det vill säga för alla ). D. För alla är matrisen strikt positiv. E. För , matrisen tenderar till en strikt positiv matris, där alla rader sammanfaller (och, uppenbarligen, sammanfaller med jämviktsfördelningen).

Exempel

Betrakta tretillstånds Markov-kedjor med kontinuerlig tid, motsvarande övergångsdiagrammen som visas i fig. I fall (a) är endast följande off-diagonala element i intensitetsmatrisen icke-noll , i fall (b) är endast icke-noll , och i fall (c) är de . De återstående elementen bestäms av matrisens egenskaper (summan av elementen i varje rad är 0). Som ett resultat, för graferna (a), (b), (c) ser intensitetsmatriserna ut så här:

Grundläggande kinetisk ekvation

Den grundläggande kinetiska ekvationen beskriver utvecklingen av sannolikhetsfördelningen i en Markov-kedja med kontinuerlig tid. "Grundläggande ekvation" här är inte ett epitet, utan en översättning av den engelska termen.  master ekvation . För radvektorn för sannolikhetsfördelningen har den grundläggande kinetiska ekvationen formen:

och sammanfaller i huvudsak med den direkta Kolmogorov-ekvationen . I den fysiska litteraturen används kolumnvektorer av sannolikheter oftare och den grundläggande kinetiska ekvationen är skriven i en form som uttryckligen använder lagen om bevarande av total sannolikhet:

var

Om det finns en positiv jämvikt för den grundläggande kinetiska ekvationen kan den skrivas på formen

Lyapunov fungerar för den grundläggande kinetiska ekvationen

För den kinetiska huvudekvationen finns det en rik familj av konvexa Lyapunov  -funktioner - sannolikhetsfördelningsfunktioner som förändras monotont med tiden. Låta vara  en konvex funktion av en variabel. För varje positiv sannolikhetsfördelning ( ) definierar vi Morimoto-funktionen :

.

Tidsderivatan , om den uppfyller den grundläggande kinetiska ekvationen, är

.

Den sista ojämlikheten är giltig på grund av konvexitet .

Exempel på Morimotos funktioner
  • , ;
denna funktion är avståndet från den aktuella sannolikhetsfördelningen till jämvikts-1-in - normen . Tidsförskjutning är en sammandragning av utrymmet för sannolikhetsfördelningar i denna norm. (För egenskaperna hos sammandragningar, se uppsatsen Banachs Fixed Point Theorem .)
  • , ;
denna funktion är (minus) Kullback- entropin (se Kullback-Leibler-avstånd ). I fysiken motsvarar det den fria energin dividerat med (där  är Boltzmann-konstanten ,  är den absoluta temperaturen ): if ( Boltzmann distribution ) alltså .
  • , ;
denna funktion är den fria energianalogen av Burg-entropin, som används i stor utsträckning vid signalbehandling:
  • , ;
detta är en kvadratisk approximation för (minus) Kullback-entropin nära jämviktspunkten. Upp till en tidskonstant term är denna funktion densamma som (minus) Fisher-entropin som ges av följande val,
  • , ;
detta är (minus) Fisher-entropin .
  • , ;
detta är en av analogerna till fri energi för Tsallis entropi . tjänar som grund för den statistiska fysiken för icke omfattande kvantiteter. Vid , tenderar den till den klassiska Boltzmann-Gibbs-Shannon-entropin, och motsvarande Morimoto-funktion tenderar till (minus) Kullback-entropin.

Praktisk tillämpning

En av de första vetenskapliga disciplinerna där Markov-kedjor fann praktisk tillämpning var lingvistik (särskilt textkritik ). Markov själv, för att illustrera sina resultat, studerade beroendet i växlingen av vokaler och konsonanter i de första kapitlen av " Eugen Onegin " och " Bagrov-barnbarns barndomsår " [3] .

Anteckningar

  1. ↑ "Markov kedja | Definition av Markov kedja på amerikansk engelska av Oxford Dictionaries"  . Oxford Dictionaries | Engelsk. . Lexico ordböcker | engelska (14 december 2017). Hämtad: 1 april 2020.
  2. Gagniuc, Paul A. Markov kedjar: Från teori till genomförande och  experiment . - USA, NJ: John Wiley & Sons , 2017. - S. 2-8. — ISBN 978-1-119-38755-8 .
  3. Maistrov, L.E. Utveckling av sannolikhetsbegreppet . - Nauka, 1980. - S. 188. - 269 sid.

Litteratur

  • Kelbert M. Ya., Sukhov Yu. M. Sannolikhet och statistik i exempel och problem. Volym II: Markov-kedjor som utgångspunkt för teorin om slumpmässiga processer och deras tillämpningar. - M. : MTSNMO, 2010. - 295 sid. — ISBN 978-5-94057-252-7 .
  • Markov A. A. , Utvidgning av lagen om stora tal till kvantiteter som är beroende av varandra. - Nyheter från Physics and Mathematics Society vid Kazan University. - 2:a serien. - Volym 15. (1906) - S. 135-156.
  • Markov-kedjan  / A. V. Prokhorov // Stora ryska encyklopedin  : [i 35 volymer]  / kap. ed. Yu. S. Osipov . - M .  : Great Russian Encyclopedia, 2004-2017.
  • Kemeny JG, Snell JL , Finite Markov-kedjor. — Universitetsserien i grundexamen i matematik. Princeton: Van Nostrand, 1960
    • Översättning: Kemeny J.J. , Snell J.L. Finite Markov-kedjor. — M.: Nauka. 1970. - 272 sid.
  • Zhong Kai-lai Homogena Markov-kedjor. Transl. från engelska. — M.: Mir, 1964. — 425 sid.
  • E. Nummelin , Allmänna irreducible Markov-kedjor och icke-negativa operatörer. — M.: Mir, 1989. — 207 sid.
  • Morimoto T. , Markov processer och H-satsen. — J. Phys. soc. Japan. 12 (1963), 328-331.
  • Yaglom A.M. , Yaglom I.M. , Sannolikhet och information . - M., Nauka, 1973. - 512 sid.
  • Kullback S. , Informationsteori och statistik. Wiley, New York, 1959.
  • Burg JP , The Relationship Between Maximum Entropy Spectra and Maximum Likelihood Spectra, Geophysics 37(2) (1972), 375-376.
  • Tsallis C. , Möjlig generalisering av Boltzmann-Gibbs statistik. J. Stat. Phys. 52 (1988), 479-487.
  • Rudoy Yu. G. , Generalized information entropy and non-canonical distribution in equilibrium statistical mechanics , TMF, 135:1 (2003), 3-54.
  • Gorban, Alexander N.; Gorban, Pavel A.; Domare, George. Entropy: The Markov Ordering Approach . Entropi 12, nr. 5 (2010), 1145-1193.

Länkar