Pseudo-invers matris

Den aktuella versionen av sidan har ännu inte granskats av erfarna bidragsgivare och kan skilja sig väsentligt från versionen som granskades den 19 juli 2021; kontroller kräver 2 redigeringar .

En pseudo-invers matris är en generalisering av begreppet en invers matris i linjär algebra . Pseudo-inversen av en matris betecknas med . $A$ $A^+$

Konceptet med pseudoinversintegrerande operatörer introducerades först 1903 av Fredholm . Den mest kända är Moore-Penrose pseudo-omvandlingen , som beskrevs oberoende av Eliakim Moore [1] 1920 och Roger Penrose [2] 1955 ; påståendet att en pseudoinvers matris existerar och är unik för någon matris över de reella och komplexa talen kallas Moore-Penrose-satsen .

En generaliserad invers ären pseudo-inversion som uppfyller strängare villkor . Pseudo-inversion kan förstås som lösningen av det bästa approximationsproblemet (genom minsta kvadratmetoden med den begränsande regulariseringsvarianten ) för motsvarande system av linjära ekvationer . Den pseudo-inversa matrisen kan beräknas med hjälp av singularvärdesuppdelningen av matrisen.

Definition

$A^+$ kallas en pseudo-invers matris för en matris om den uppfyller följande kriterier: $A$

$AA^+A = A$ ;
$A^+AA^+ = A^+$ ( är en svag inversion i en multiplikativ semigrupp); $A^+$
$(AA^+)^* = AA^+$ (detta betyder att det är en hermitisk matris ); $AA^+$
$(A^+A)^* = A^+A$ ( är också en hermitisk matris). $A^+A$

Här är den hermitiska konjugatmatrisen M ( för matriser över fältet av reella tal ). $M^*$ $M^* = M^T$

Det finns ett likvärdigt sätt att specificera en pseudo-invers matris i termer av gränsen för inverser ( Tikhonov-regularisering ):

A^+ = \lim_{\delta \to +0} (A^* A + \delta I)^{-1} A^* = \lim_{\delta \to +0} A^* (AA^* + \delta I)^{-1}

var finns identitetsmatrisen. Denna gräns finns även om den inte är definierad. $jag$ $(AA^*)^{-1}$ $(A^* A)^{-1}$

Egenskaper

Pseudo -inversion är involutiv (det vill säga denna operation är omvänd till sig själv): $(A^+)^+ = A$ .
Pseudo-inversion pendlar med transponering, konjugation och hermitisk konjugation : $(A^T)^+ = (A^+)^T$ , , .
$(\överlinje{A})^+ = \överlinje{A^+}$
$(A^*)^+ = (A^+)^*$
Den pseudoinversa produkten av en matris och en skalär är lika med motsvarande produkt av en matris och dess reciproka : $A$ $\alfa$ $A^+$ $\alpha^{-1}$ $(\alpha A)^+ = \alpha^{-1} A^+$ , för . $\alpha \neq 0$
Om den pseudo-inversa matrisen för redan är känd kan den användas för att beräkna : $A^*A$ $A^+$ $A^+ = (A^*A)^+A^*$ .
På samma sätt, om matrisen redan är känd: $(AA^*)^+$ $A^+ = A^*(AA^*)^+$ .

Särskilda tillfällen

Om kolumnerna i en matris är linjärt beroende är matrisen inverterbar. I det här fallet ges den pseudo-inversa matrisen av formeln: $A$ $A^* A$

A^+ = (A^* A)^{-1} A^*

Om kolumnerna är linjärt oberoende (vilket är sant för kvadratiska icke-singulära matriser), så är pseudo-inversionen densamma som inversionen:

A^+ = A^{-1}

Om och är sådana att produkten är definierad och: $A$ $B$ $AB$

antingen , $A^* A = I$
antingen , $BB^* = I$
antingen är kolumnerna linjärt oberoende och raderna är linjärt oberoende, $A$ $B$

sedan

(AB)^+ = B^+ A^+

Pseudo-reversering kan tillämpas på både skalärer och vektorer. Detta innebär att de behandlas som matriser av lämplig dimension. Pseudo-inversen till en skalär är noll om den är noll, och inversen till annars: $x$ $x$ $x$

x^+ = \left\{\begin{matrix} 0, & x=0; \\ x^{-1}, & x \ne 0. \end{matris}\right.

Pseudo-inversen för nollvektorn är den transponerade nollvektorn. Pseudo-inversen för en vektor som inte är noll är den konjugerade transponerade vektorn dividerad med kvadraten på dess längd:

x^+ = \left\{\begin{matris} 0^T, & x = 0; \\ {x^* \över x^* x}, & x \ne 0. \end{matris}\right.

För att bevisa det räcker det att verifiera att dessa kvantiteter uppfyller definitionen av pseudoinverser.

Ursprung

Om det finns, då från jämställdheten: $(A^* A)^{-1}$

ax = b,

skall

A^* A x = A^* b,

(A^* A)^{-1}(A^* A) x = (A^* A)^{-1}A^* b,

x = (A^* A)^{-1}A^* b,

vilket ger upphov till begreppet pseudo-reversering

A^+ = (A^* A)^{-1}A^*

Beräkning

Låt vara rangen av en matris av storlek . Då kan representeras som , där B är en storleksmatris med linjärt oberoende kolumner och är en storleksmatris med linjärt oberoende rader. Sedan: $k$ $A$ $m\ gånger n$ $A$ $A=BC$ $m \tid k$ $C$ $k \ gånger n$

A^+ = C^*(CC^*)^{-1}(B^*B)^{-1}B^*

Om den har en helradsrankning, det vill säga , kan identitetsmatrisen väljas och formeln reduceras till . På samma sätt, om har en full-kolumn ranking, det vill säga , då . $A$ $k = m$ $B$ $A^+ = A^*(AA^*)^{-1}$ $A$ $k = n$ $A^+ = (A^*A)^{-1}A^*$

Det enklaste beräkningssättet att få en pseudo-invers matris är att använda en singularvärdesuppdelning .

Om är en singularvärdesuppdelning , då . För en diagonal matris som , erhålls pseudoinversen från den genom att ersätta varje element som inte är noll på diagonalen med dess invers. $A = U\Sigma V^*$ $A$ $A^+ = V\Sigma^+ U^*$ $\Sigma$

Det finns optimerade metoder för att beräkna pseudoinversen för blockmatriser.

Ibland kan volymen av beräkningar för att hitta en pseudo-invers matris minskas om pseudo-inversen för någon liknande matris är känd. I synnerhet, om en liknande matris skiljer sig från den initiala en efter en ändrad, tillagd eller raderad kolumn eller rad, finns det ackumulerande algoritmer som kan använda förhållandet mellan matriser.

Applikation

Pseudo-inversion är nära besläktad med metoden för minsta kvadrater (LSM) för ett system av linjära ekvationer [3] .

I denna metod ersätts problemet med att lösa det givna systemet av problemet med att minimera den kvadratiska euklidiska normen för diskrepansen . I praktiken används LSM vanligtvis när det ursprungliga systemet är inkonsekvent, men nedan kommer vi att överväga fallet när detta system är kompatibelt. $A x = b$ $\|Yxa - b\|^2$ $A x = b$

Den allmänna lösningen av ett inhomogent system kan representeras som summan av en viss lösning av ett inhomogent system och den allmänna lösningen av motsvarande homogena system . $A x = b$ $A x = 0$

Lemma: Om det finns, så är den allmänna lösningen alltid representerad som summan av den pseudoinversa lösningen av det inhomogena systemet och lösningen av det homogena systemet: $(AA^*)^{-1}$ $x$

x=A^{*}(AA^{*})^{-1}b+(IA^{*}(AA^{*})^{-1}A)y.

Bevis:

$Yxa$	$=$	$AA^(AA^)^{-1}$	$b$	$+$	$A y - AA^(AA^)^{-1} A y$
$Yxa$	$=$		$b$	$+$	$A y - A y$
$Yxa$	$=$		$b$	.

Här är vektorn godtycklig (upp till dimension). De andra två termerna har en pseudo-invers matris . Om vi skriver om det i formuläret tar vi uttrycket till formuläret: $y$ $A^*(AA^*)^{-1}$ $A^+$

x=A^{+}b+(IA^{+}A)y.

Den första termen är en pseudo-invers lösning. När det gäller minsta kvadratmetoden, är , vilket ger den lägsta euklidiska normen för residuet. Nästa term ger en lösning på det homogena systemet , eftersom projektionsoperatören är på bilden av operatören och följaktligen är projektionsoperatören på operatörens kärna . $x$ $A x = 0$ $A^{+}A=A^{*}(AA^{*})^{-1}A$ $A^{*}$ $(IA^{+}A)$ $A$

Litteratur

↑ E. H. Moore: Om den allmänna algebraiska matrisens ömsesidighet. Bulletin of the American Mathematical Society 26, 394-395 (1920) 7.pdf
↑ Roger Penrose: En generaliserad invers för matriser. Proceedings of the Cambridge Philosophical Society 51, 406-413 (1955)
↑ Roger Penrose: På bästa ungefärliga lösning av linjära matrisekvationer. Proceedings of the Cambridge Philosophical Society 52, 17-19 (1956)
↑ Albert A.: Regression, pseudo-inversion och rekursiv uppskattning. transl. från engelska. Moskva, "Nauka", 224 s. (1977)
↑ Beklemishev D.V.: Ytterligare kapitel i linjär algebra. Moskva, vetenskap. (1983)