Markov kedja
Den aktuella versionen av sidan har ännu inte granskats av erfarna bidragsgivare och kan skilja sig väsentligt från
versionen som granskades den 28 december 2019; kontroller kräver
9 redigeringar .
En Markov-kedja är en sekvens av slumpmässiga händelser med ett ändligt eller räknebart antal utfall , där sannolikheten för att varje händelse inträffar endast beror på tillståndet som nåddes i föregående händelse [1] . Den kännetecknas av egenskapen att löst uttryckt, med en fast nutid, är framtiden oberoende av det förflutna. Namngiven för att hedra A. A. Markov (senior) , som först introducerade detta koncept i arbetet 1906. [2]
Diskret-tid Markov kedja
Definition
En sekvens av diskreta slumpvariabler kallas en enkel Markov-kedja (med diskret tid) if
.
Således, i det enklaste fallet, beror den villkorliga fördelningen av nästa tillstånd av Markov-kedjan endast på det aktuella tillståndet och beror inte på alla tidigare tillstånd (till skillnad från högre ordningens Markov-kedjor).
Omfånget av slumpvariabler kallas kedjans tillståndsutrymme , och talet är stegnumret.
Övergångsmatris och homogena kedjor
Matrix , var
kallas matrisen av övergångssannolikheter i det -e steget, och vektorn , där
— Den första distributionen av Markov-kedjan.
Uppenbarligen är övergångssannolikhetsmatrisen rätt stokastisk , dvs.
.
En Markovkedja kallas homogen om övergångssannolikhetsmatrisen inte beror på stegnumret, dvs.
.
Annars kallas Markov-kedjan inhomogen. I det följande kommer vi att anta att vi har att göra med homogena Markov-kedjor.
Finita dimensionella fördelningar och n-stegs övergångsmatrisen
Från egenskaperna för betingad sannolikhet och definitionen av en homogen Markov-kedja får vi:
,
varav specialfallet med Kolmogorov-Chapman-ekvationen följer:
,
det vill säga matrisen av övergångssannolikheter per steg i en homogen Markov-kedja är den -e graden av matrisen av övergångssannolikheter per 1 steg. Till sist,
.
Tillståndstyper
Exempel
Markovkedja med kontinuerlig tid
Definition
En familj av diskreta slumpvariabler kallas en Markov-kedja (med kontinuerlig tid) if
.
En Markovkedja med kontinuerlig tid sägs vara homogen if
.
Matrisen av övergångsfunktioner och Kolmogorov-Chapman-ekvationen
Liksom i fallet med diskret tid, bestäms de finita dimensionella fördelningarna av en kontinuerlig tidshomogen Markov-kedja helt av den initiala fördelningen
och matrisen av övergångsfunktioner ( övergångssannolikheter )
.
Matrisen av övergångssannolikheter uppfyller Kolmogorov-Chapmans ekvation : eller
Intensitetsmatrisen och Kolmogorovs differentialekvationer
Per definition är intensitetsmatrisen , eller motsvarande,
.
Två ekvationer följer från Kolmogorov-Chapmans ekvation:
För båda ekvationerna väljs initialvillkoret . Lämplig lösning
Egenskaper för matriserna P och Q
För varje matris har följande egenskaper:
- Matriselement är icke-negativa: (icke-negativitet av sannolikheter).
- Summan av elementen i varje rad är 1: (full sannolikhet), det vill säga matrisen är högerstokastisk (eller radvis).
- Alla matrisegenvärden överstiger inte 1 i absolut värde: . Om , då .
- Matrisens egenvärde motsvarar minst en icke-negativ vänster egenvektor - rad (jämvikt): .
- För ett egenvärde för en matris är alla rotvektorer egenvektorer, det vill säga att motsvarande Jordan-celler är triviala.
Matrisen har följande egenskaper:
- Off- diagonala matriselement är icke-negativa: .
- Diagonala matriselement är icke-positiva: .
- Summan av elementen i varje rad är 0:
- Den reella delen av alla matrisegenvärden är icke-positiv: . Om , då
- Matrisens egenvärde motsvarar minst en icke-negativ egenvektor på vänster rad (jämvikt):
- För ett egenvärde för en matris är alla rotvektorer egenvektorer, det vill säga att motsvarande Jordan-celler är triviala.
Övergångsdiagram, anslutningsmöjligheter och ergodiska Markov-kedjor
För en Markov-kedja med kontinuerlig tid är en riktad övergångsgraf (kortfattat en övergångsgraf) konstruerad enligt följande regler:
- Uppsättningen av grafens hörn sammanfaller med uppsättningen av kedjetillstånd.
- Topparna är förbundna med en orienterad kant om (det vill säga intensiteten av flödet från -th tillståndet -th är positivt).
De topologiska egenskaperna hos övergångsgrafen är relaterade till matrisens spektrala egenskaper . I synnerhet gäller följande satser för ändliga Markov-kedjor:
- Följande tre egenskaper A, B, C för en ändlig Markov-kedja är ekvivalenta (kedjor som har dem kallas ibland svagt ergodiska ):
S. För två olika hörn av övergångsgrafen finns det en sådan vertex på grafen ("common drain") att det finns orienterade banor från vertex till vertex och från vertex till vertex . Obs : möjligt fall eller ; i detta fall anses en trivial (tom) väg från till eller från till också vara en riktad väg.
B. Ett nollegenvärde för en matris är icke degenererat.
C. För , matrisen tenderar till en matris där alla rader sammanfaller (och, uppenbarligen, sammanfaller med jämviktsfördelningen).
- Följande fem egenskaper A, B, C, D, D för en ändlig Markov-kedja är ekvivalenta (kedjor som har dem kallas ergodiska ):
A. Övergångsdiagrammet för en kedja är riktningsförbundet.
B. Nollegenvärdet för en matris är icke degenererat och motsvarar en strikt positiv vänsteregenvektor (jämviktsfördelning).
B. För vissa är matrisen strikt positiv (det vill säga för alla ).
D. För alla är matrisen strikt positiv.
E. För , matrisen tenderar till en strikt positiv matris, där alla rader sammanfaller (och, uppenbarligen, sammanfaller med jämviktsfördelningen).
Exempel
Betrakta tretillstånds Markov-kedjor med kontinuerlig tid, motsvarande övergångsdiagrammen som visas i fig. I fall (a) är endast följande off-diagonala element i intensitetsmatrisen icke-noll , i fall (b) är endast icke-noll , och i fall (c) är de . De återstående elementen bestäms av matrisens egenskaper (summan av elementen i varje rad är 0). Som ett resultat, för graferna (a), (b), (c) ser intensitetsmatriserna ut så här:
Grundläggande kinetisk ekvation
Den grundläggande kinetiska ekvationen beskriver utvecklingen av sannolikhetsfördelningen i en Markov-kedja med kontinuerlig tid. "Grundläggande ekvation" här är inte ett epitet, utan en översättning av den engelska termen. master ekvation . För radvektorn för sannolikhetsfördelningen har den grundläggande kinetiska ekvationen formen:
och sammanfaller i huvudsak med den direkta Kolmogorov-ekvationen . I den fysiska litteraturen används kolumnvektorer av sannolikheter oftare och den grundläggande kinetiska ekvationen är skriven i en form som uttryckligen använder lagen om bevarande av total sannolikhet:
var
Om det finns en positiv jämvikt för den grundläggande kinetiska ekvationen kan den skrivas på formen
Lyapunov fungerar för den grundläggande kinetiska ekvationen
För den kinetiska huvudekvationen finns det en rik familj av konvexa Lyapunov -funktioner - sannolikhetsfördelningsfunktioner som förändras monotont med tiden. Låta vara en konvex funktion av en variabel. För varje positiv sannolikhetsfördelning ( ) definierar vi Morimoto-funktionen :
.
Tidsderivatan , om den uppfyller den grundläggande kinetiska ekvationen, är
.
Den sista ojämlikheten är giltig på grund av konvexitet .
Exempel på Morimotos funktioner
- , ;
denna funktion är avståndet från den aktuella sannolikhetsfördelningen till jämvikts-1-in -
normen . Tidsförskjutning är en sammandragning av utrymmet för sannolikhetsfördelningar i denna norm. (För egenskaperna hos sammandragningar, se uppsatsen
Banachs Fixed Point Theorem .)
- , ;
denna funktion är (minus) Kullback-
entropin (se
Kullback-Leibler-avstånd ). I fysiken motsvarar det den
fria energin dividerat med (där är
Boltzmann-konstanten , är den absoluta
temperaturen ):
if (
Boltzmann distribution ) alltså
.
- , ;
denna funktion är den fria energianalogen av Burg-entropin, som används i stor utsträckning vid signalbehandling:
- , ;
detta är en kvadratisk approximation för (minus) Kullback-entropin nära jämviktspunkten. Upp till en tidskonstant term är denna funktion densamma som (minus) Fisher-entropin som ges av följande val,
- , ;
detta är (minus)
Fisher-entropin .
- , ;
detta är en av analogerna till fri energi för
Tsallis entropi .
tjänar som grund för den statistiska fysiken för icke omfattande kvantiteter. Vid , tenderar den till den klassiska Boltzmann-Gibbs-Shannon-entropin, och motsvarande Morimoto-funktion tenderar till (minus) Kullback-entropin.
Praktisk tillämpning
En av de första vetenskapliga disciplinerna där Markov-kedjor fann praktisk tillämpning var lingvistik (särskilt textkritik ). Markov själv, för att illustrera sina resultat, studerade beroendet i växlingen av vokaler och konsonanter i de första kapitlen av " Eugen Onegin " och " Bagrov-barnbarns barndomsår " [3] .
Anteckningar
- ↑ "Markov kedja | Definition av Markov kedja på amerikansk engelska av Oxford Dictionaries" . Oxford Dictionaries | Engelsk. . Lexico ordböcker | engelska (14 december 2017). Hämtad: 1 april 2020.
- ↑ Gagniuc, Paul A. Markov kedjar: Från teori till genomförande och experiment . - USA, NJ: John Wiley & Sons , 2017. - S. 2-8. — ISBN 978-1-119-38755-8 .
- ↑ Maistrov, L.E. Utveckling av sannolikhetsbegreppet . - Nauka, 1980. - S. 188. - 269 sid.
Litteratur
- Kelbert M. Ya., Sukhov Yu. M. Sannolikhet och statistik i exempel och problem. Volym II: Markov-kedjor som utgångspunkt för teorin om slumpmässiga processer och deras tillämpningar. - M. : MTSNMO, 2010. - 295 sid. — ISBN 978-5-94057-252-7 .
- Markov A. A. , Utvidgning av lagen om stora tal till kvantiteter som är beroende av varandra. - Nyheter från Physics and Mathematics Society vid Kazan University. - 2:a serien. - Volym 15. (1906) - S. 135-156.
- Markov-kedjan / A. V. Prokhorov // Stora ryska encyklopedin : [i 35 volymer] / kap. ed. Yu. S. Osipov . - M . : Great Russian Encyclopedia, 2004-2017.
- Kemeny JG, Snell JL , Finite Markov-kedjor. — Universitetsserien i grundexamen i matematik. Princeton: Van Nostrand, 1960
- Översättning: Kemeny J.J. , Snell J.L. Finite Markov-kedjor. — M.: Nauka. 1970. - 272 sid.
- Zhong Kai-lai Homogena Markov-kedjor. Transl. från engelska. — M.: Mir, 1964. — 425 sid.
- E. Nummelin , Allmänna irreducible Markov-kedjor och icke-negativa operatörer. — M.: Mir, 1989. — 207 sid.
- Morimoto T. , Markov processer och H-satsen. — J. Phys. soc. Japan. 12 (1963), 328-331.
- Yaglom A.M. , Yaglom I.M. , Sannolikhet och information . - M., Nauka, 1973. - 512 sid.
- Kullback S. , Informationsteori och statistik. Wiley, New York, 1959.
- Burg JP , The Relationship Between Maximum Entropy Spectra and Maximum Likelihood Spectra, Geophysics 37(2) (1972), 375-376.
- Tsallis C. , Möjlig generalisering av Boltzmann-Gibbs statistik. J. Stat. Phys. 52 (1988), 479-487.
- Rudoy Yu. G. , Generalized information entropy and non-canonical distribution in equilibrium statistical mechanics , TMF, 135:1 (2003), 3-54.
- Gorban, Alexander N.; Gorban, Pavel A.; Domare, George. Entropy: The Markov Ordering Approach . Entropi 12, nr. 5 (2010), 1145-1193.
Länkar
Ordböcker och uppslagsverk |
|
---|
I bibliografiska kataloger |
|
---|
Typer av artificiella neurala nätverk |
---|
|