Hessiska funktioner

Den aktuella versionen av sidan har ännu inte granskats av erfarna bidragsgivare och kan skilja sig väsentligt från versionen som granskades den 24 december 2021; kontroller kräver 2 redigeringar .

En funktions hessian  är en symmetrisk kvadratisk form [1] som beskriver beteendet hos en funktion i andra ordningen.

För en funktion som är dubbelt differentierbar vid en punkt

eller

där (eller ) och funktionen definieras på -dimensionellt reellt utrymme (eller komplext utrymme ) med koordinater (eller ). I båda fallen är hessian en kvadratisk form som ges på tangentrymden , som inte förändras under linjära transformationer av variablerna. Hessian kallas också ofta för determinanten för en matris, se nedan.

Hessisk matris

Matrisen för denna kvadratiska form bildas av funktionens andra partiella derivator. Om alla derivat finns, då

Determinanten för denna matris kallas den hessiska determinanten , eller helt enkelt den hessiska .

Hessiska matriser används i optimeringsproblem enligt Newtons metod . Den fullständiga beräkningen av den hessiska matrisen kan vara svår, så kvasi-newtonska algoritmer har utvecklats baserat på ungefärliga uttryck för den hessiska matrisen. Den mest kända av dem är Broyden-Fletcher-Goldfarb-Shanno-algoritmen .

Symmetri av den hessiska matrisen

De blandade derivatorna av funktionen f  är de element i den hessiska matrisen som inte finns på huvuddiagonalen . Om de är kontinuerliga är differentieringsordningen inte viktig:

Detta kan också skrivas som

I det här fallet är den hessiska matrisen symmetrisk .

Kritiska punkter för en funktion

Om gradienten (dess vektorderivata ) är noll någon gång kallas denna punkt kritisk . Ett tillräckligt villkor för existensen av ett extremum vid denna punkt är teckendefiniiteten hos det hessiska f (förstått i detta fall som en kvadratisk form), nämligen:

Variationer och generaliseringar

Vektor-funktioner

Om  är en vektorfunktion , dvs.

sedan bildar dess andra partiella derivator inte en matris, utan en tensor av rang 3, som kan betraktas som en matris av hessiska matriser:

Vid urartar denna tensor till den vanliga hessiska matrisen.

Banded Hessian

När man löser problemet med att hitta ett villkorligt extremum för en funktion med restriktioner

där , , för att kontrollera tillräckliga förhållanden för ett extremum, kan man använda den så kallade kantade Hessian of the Lagrange-funktionen , som kommer att ha formen [2]

Verifieringen av tillräckliga extrema förhållanden består i att beräkna tecknen på bestämningsfaktorerna för en viss uppsättning submatriser av den gränsade Hessian. Nämligen om det finns sådana att och

för , då har funktionen ett strikt villkorligt minimum vid punkten . Om

för , då har funktionen vid punkten ett strikt villkorligt maximum [3] .

Historik

Konceptet introducerades av Ludwig Otto Hesse ( 1844 ), som använde ett annat namn. Termen "Hessian" myntades av James Joseph Sylvester .

Se även

Anteckningar

  1. Hessian . Hämtad 2 april 2016. Arkiverad från originalet 15 april 2016.
  2. Hallam, Arne Econ 500: Quantitative Methods in Economic Analysis I. Iowa State (7 oktober 2004). Hämtad 14 april 2021. Arkiverad från originalet 19 april 2021.
  3. Neudecker, Heinz. Matrisdifferentialkalkyl med tillämpningar i statistik och ekonometri / Heinz Neudecker, Jan R. Magnus. - New York: John Wiley & Sons , 1988. - S. 136. - ISBN 978-0-471-91516-4 .

Länkar