En pseudo-invers matris är en generalisering av begreppet en invers matris i linjär algebra . Pseudo-inversen av en matris betecknas med .
Konceptet med pseudoinversintegrerande operatörer introducerades först 1903 av Fredholm . Den mest kända är Moore-Penrose pseudo-omvandlingen , som beskrevs oberoende av Eliakim Moore [1] 1920 och Roger Penrose [2] 1955 ; påståendet att en pseudoinvers matris existerar och är unik för någon matris över de reella och komplexa talen kallas Moore-Penrose-satsen .
En generaliserad invers ären pseudo-inversion som uppfyller strängare villkor . Pseudo-inversion kan förstås som lösningen av det bästa approximationsproblemet (genom minsta kvadratmetoden med den begränsande regulariseringsvarianten ) för motsvarande system av linjära ekvationer . Den pseudo-inversa matrisen kan beräknas med hjälp av singularvärdesuppdelningen av matrisen.
kallas en pseudo-invers matris för en matris om den uppfyller följande kriterier:
Här är den hermitiska konjugatmatrisen M ( för matriser över fältet av reella tal ).
Det finns ett likvärdigt sätt att specificera en pseudo-invers matris i termer av gränsen för inverser ( Tikhonov-regularisering ):
,var finns identitetsmatrisen. Denna gräns finns även om den inte är definierad.
Om kolumnerna i en matris är linjärt beroende är matrisen inverterbar. I det här fallet ges den pseudo-inversa matrisen av formeln:
.Om kolumnerna är linjärt oberoende (vilket är sant för kvadratiska icke-singulära matriser), så är pseudo-inversionen densamma som inversionen:
.Om och är sådana att produkten är definierad och:
sedan
.Pseudo-reversering kan tillämpas på både skalärer och vektorer. Detta innebär att de behandlas som matriser av lämplig dimension. Pseudo-inversen till en skalär är noll om den är noll, och inversen till annars:
Pseudo-inversen för nollvektorn är den transponerade nollvektorn. Pseudo-inversen för en vektor som inte är noll är den konjugerade transponerade vektorn dividerad med kvadraten på dess längd:
För att bevisa det räcker det att verifiera att dessa kvantiteter uppfyller definitionen av pseudoinverser.
Om det finns, då från jämställdheten:
skall
vilket ger upphov till begreppet pseudo-reversering
.Låt vara rangen av en matris av storlek . Då kan representeras som , där B är en storleksmatris med linjärt oberoende kolumner och är en storleksmatris med linjärt oberoende rader. Sedan:
.Om den har en helradsrankning, det vill säga , kan identitetsmatrisen väljas och formeln reduceras till . På samma sätt, om har en full-kolumn ranking, det vill säga , då .
Det enklaste beräkningssättet att få en pseudo-invers matris är att använda en singularvärdesuppdelning .
Om är en singularvärdesuppdelning , då . För en diagonal matris som , erhålls pseudoinversen från den genom att ersätta varje element som inte är noll på diagonalen med dess invers.
Det finns optimerade metoder för att beräkna pseudoinversen för blockmatriser.
Ibland kan volymen av beräkningar för att hitta en pseudo-invers matris minskas om pseudo-inversen för någon liknande matris är känd. I synnerhet, om en liknande matris skiljer sig från den initiala en efter en ändrad, tillagd eller raderad kolumn eller rad, finns det ackumulerande algoritmer som kan använda förhållandet mellan matriser.
Pseudo-inversion är nära besläktad med metoden för minsta kvadrater (LSM) för ett system av linjära ekvationer [3] .
I denna metod ersätts problemet med att lösa det givna systemet av problemet med att minimera den kvadratiska euklidiska normen för diskrepansen . I praktiken används LSM vanligtvis när det ursprungliga systemet är inkonsekvent, men nedan kommer vi att överväga fallet när detta system är kompatibelt.
Den allmänna lösningen av ett inhomogent system kan representeras som summan av en viss lösning av ett inhomogent system och den allmänna lösningen av motsvarande homogena system .
Lemma: Om det finns, så är den allmänna lösningen alltid representerad som summan av den pseudoinversa lösningen av det inhomogena systemet och lösningen av det homogena systemet:
Bevis:
. |
Här är vektorn godtycklig (upp till dimension). De andra två termerna har en pseudo-invers matris . Om vi skriver om det i formuläret tar vi uttrycket till formuläret:
Den första termen är en pseudo-invers lösning. När det gäller minsta kvadratmetoden, är , vilket ger den lägsta euklidiska normen för residuet. Nästa term ger en lösning på det homogena systemet , eftersom projektionsoperatören är på bilden av operatören och följaktligen är projektionsoperatören på operatörens kärna .