Softmax

Softmax är en generalisering av den logistiska funktionen för det flerdimensionella fallet. Funktionen omvandlar en dimensionsvektor till en vektor med samma dimension, där varje koordinat för den resulterande vektorn representeras av ett reellt tal i intervallet [0,1] och summan av koordinaterna är 1.

Koordinaterna beräknas enligt följande:

Applikationer i maskininlärning

Softmax-funktionen används i maskininlärning för klassificeringsproblem när antalet möjliga klasser är fler än två (en logistisk funktion används för två klasser). Koordinaterna för den resulterande vektorn behandlas som sannolikheter för att objektet tillhör klassen . Kolumnvektorn beräknas enligt följande:

där är en kolumnvektor av egenskaper hos ett dimensionsobjekt ; är den transponerade matrisen av viktkoefficienter för egenskaper, som har dimensionen ; är en kolumnvektor med tröskeldimensionsvärden (se perceptron ), där är antalet objektklasser och är antalet objektegenskaper.

Ofta används Softmax för det sista lagret av djupa neurala nätverk för klassificeringsuppgifter. I detta fall används korsentropi som en förlustfunktion för att träna det neurala nätverket .