Q -learning är en metod som används inom artificiell intelligens med ett agentbaserat tillvägagångssätt . Syftar på förstärkningsinlärningsexperiment . Baserat på belöningen från omgivningen bildar agenten en nyttofunktion Q, som därefter ger honom möjlighet att inte slumpmässigt välja en beteendestrategi, utan att ta hänsyn till erfarenheten av tidigare interaktion med omgivningen. En av fördelarna med Q-learning är att det kan jämföra den förväntade nyttan av tillgängliga aktiviteter utan att behöva modellera miljön. Gäller situationer som kan representeras som en Markov beslutsprocess .
Maskininlärning och datautvinning | |
---|---|
Uppgifter | |
Att lära sig med en lärare | |
klusteranalys | |
Dimensionalitetsreduktion | |
Strukturell prognos | |
Anomali upptäckt | |
Grafisk probabilistiska modeller | |
Neurala nätverk | |
Förstärkningsinlärning |
|
Teori | |
Tidskrifter och konferenser |
|