Hidden Markov Model ( HMM ) är en statistisk modell som simulerar driften av en process som liknar en Markov-process med okända parametrar, och uppgiften är att gissa de okända parametrarna utifrån de observerade. De erhållna parametrarna kan användas i ytterligare analys, till exempel för mönsterigenkänning. HMM kan betraktas som det enklaste Bayesianska trosnätverket .
De första anteckningarna om dolda Markov-modeller publicerades av Baum på 1960-talet, och redan på 70-talet användes de först i taligenkänning. Sedan mitten av 1980-talet har SMM använts för analys av biologiska sekvenser, särskilt DNA.
Den huvudsakliga tillämpningen av HMM mottogs inom området taligenkänning, skrift, rörelser och bioinformatik. Dessutom används HMMs i kryptoanalys , maskinöversättning .
Låt oss föreställa oss två vänner som diskuterar i telefon varje kväll vad de gjorde under dagen. Din vän kan bara göra tre saker: gå i parken, shoppa eller städa rummet. Hans val baseras enbart på det väder som var vid tidpunkten för beslutet. Du vet ingenting om vädret i regionen där din vän bor, men du kan, utifrån hans beslut, försöka gissa hur vädret var.
Vädret representeras som en Markov-kedja, den har två tillstånd: soligt eller regnigt, men du kan inte se det själv, så det är dolt för dig. Varje dag fattar din vän ett av tre möjliga beslut: gå, shoppa eller städa. Du kan lära dig om din väns beslut, så detta är ett observerbart värde. I allmänhet tar vi emot SMM.
I en konventionell Markov-modell är tillståndet synligt för observatören, så övergångssannolikheterna är den enda parametern. I en dold Markov-modell kan vi bara hålla reda på de variabler som påverkas av ett givet tillstånd. Varje tillstånd har en sannolikhetsfördelning mellan alla möjliga utvärden. Därför ger sekvensen av tecken som genereras av HMM information om sekvensen av tillstånd.
Diagrammet nedan visar den allmänna strukturen för HMM. Ovalerna representerar variabler med ett slumpmässigt värde. Slumpvariabeln är värdet på den dolda variabeln vid tidpunkten . En slumpvariabel är värdet av en observerad variabel vid tidpunkten . Pilarna i diagrammet representerar villkorliga beroenden.
Det blir tydligt av diagrammet att värdet på den dolda variabeln (at time ) endast beror på värdet på den dolda variabeln (at time ). Detta kallas Markov-egendomen. Även om samtidigt värdet av den observerade variabeln bara beror på värdet av den latenta variabeln (båda vid tidpunkten ).
Sannolikheten att se en längdsekvens är
här löper summan över alla möjliga sekvenser av dolda noder . Den brute-force-beräkningsmetoden är mycket tidskrävande för många problem från det verkliga livet på grund av att antalet möjliga sekvenser av dolda noder är mycket stort. Men användningen av framåt-bakåt- proceduren [1] kan avsevärt öka hastigheten på beräkningarna.
Det finns tre huvuduppgifter förknippade med SMM:
Grafisk probabilistiska modeller | |
---|---|
|
Maskininlärning och datautvinning | |
---|---|
Uppgifter | |
Att lära sig med en lärare | |
klusteranalys | |
Dimensionalitetsreduktion | |
Strukturell prognos | |
Anomali upptäckt | |
Grafisk probabilistiska modeller | |
Neurala nätverk | |
Förstärkningsinlärning |
|
Teori | |
Tidskrifter och konferenser |
|