Geometriskt centrum

Det geometriska centrumet för en diskret uppsättning punkter i det euklidiska rummet (i statistiska termer - prov) är den punkt där summan av avstånden till uppsättningens punkter minimeras. Det geometriska centret generaliserar medianen till en matematisk statistik som minimerar avstånden i ett endimensionellt dataprov. Således speglar det geometriska centret den centrala trenden i högdimensionella utrymmen. Begreppet är också känt under namnen 1-median [1] , rumslig median [2] , eller Torricelli-punkt [3] .

Det geometriska centret är en viktig förskjutningsuppskattare i statistik [4] , där detta koncept är känt som L 1 -poängen [5] . Att hitta det geometriska centrumet är också en standarduppgift när man placerar föremål , där objektens placering (produktion eller konsumtion) modelleras för att minimera transportkostnaderna [6]

Ett specialfall av problemet för tre punkter i planet (det vill säga m =3 och n =2 i termerna som beskrivs nedan) beskrivs ibland som Fermats problem. Det uppstår i konstruktionen av minimala Steiner-träd och ställdes först som ett problem av Pierre de Fermat och löstes av Evangelista Torricelli [7] . Lösningen på detta problem är nu känd som Fermatpunkten i triangeln [8] . I sin tur kan sökningen efter det geometriska centret generaliseras till problemet med att minimera summan av viktade avstånd. Detta problem är känt som Weber-problemet eftersom Alfred Weber diskuterade detta problem i en bok från 1909 om objektplacering [2] . Vissa källor använder istället namnet Fermat–Weber problem [9] , men vissa källor använder samma namn för det oviktade problemet [10]

Vesolovsky [11] gav en översikt över problemet med geometriska centrum. Se artikeln av Fekete, Michel och Boyer [12] för en diskussion om generaliseringen av problemet till fallet med icke-diskreta mängder.

Definition

Formellt, givet en uppsättning som innehåller m punkter , där alla , definieras det geometriska centrumet som

geometriskt centrum

Observera att här betyder arg min värdet på argumentet vid vilket minimisumman uppnås. Detta är den punkt för vilken summan av alla euklidiska avstånd till , är minimal.

Egenskaper

Särskilda tillfällen

Beräkning

Även om konceptet med det geometriska centret är lätt att förstå, är dess beräkning svår. Tyngdpunkten för en triangel (det vill säga dess massacentrum ), definierad på samma sätt som det geometriska centrumet som minimering av summan av kvadratavstånden till varje punkt, kan erhållas med enkla formler - dess koordinater är det aritmetiska medelvärdet av koordinaterna för punkterna. Emellertid är ingen sådan enkel formel för det geometriska centrumet känd. Det har till och med visat sig att det varken finns en explicit formel eller en exakt algoritm som endast använder aritmetiska och radixoperationer. Det finns alltså bara approximationer för att lösa detta problem [16] .

Det är dock möjligt att beräkna en approximation till det geometriska centret med hjälp av en iterativ procedur där varje steg ger en mer exakt approximation. Procedurer av denna typ kan härledas från det faktum att summan av avstånden till provpunkter är en konvex funktion , eftersom avståndet till varje provpunkt är en konvex funktion, och summan av konvexa funktioner är också en konvex funktion. Proceduren för att minska summan av avstånd kan således inte falla in i det lokala optimum .

Ett sådant tillvägagångssätt är Weisfeld-algoritmen ( André Weisfeld ) [17] [18] [19] som är en typ av iterativ vägd minsta kvadrat metod med varierande vikter. Denna algoritm ställer in en uppsättning vikter som är omvänt proportionella mot avstånden till den aktuella approximationen, och beräknar en ny approximation som är det viktade medelvärdet av provpunkterna enligt dessa vikter. Det är

Metoden konvergerar från nästan alla initiala positioner, men kan misslyckas om approximationen hamnar i någon av provpunkterna. Algoritmen kan modifieras på ett sådant sätt att den konvergerar för alla startpunkter [14] .

Bose, Mageshwari och Morin [10] beskrev ett mer sofistikerat optimeringsförfarande för att hitta en ungefärlig optimal lösning på ett givet problem. Som Ne, Parrilo och Starmfils [20] har visat kan problemet ses som ett semidefinitivt programmeringsproblem .

Cohen, Lee, Miller och Pachoki [21] visade hur man beräknar det geometriska centret till godtycklig precision i nästan linjär tid.

Beskrivning av det geometriska centret

Om punkt y skiljer sig från alla givna provpunkter x j , då är y det geometriska centrum om och endast om

Detta motsvarar

som är nära besläktad med Weisfeld-algoritmen.

I allmänhet är y ett geometriskt centrum om och endast om det finns vektorer u j sådana

där för x j ≠ y ,

och för x j = y ,

En likvärdig formulering av detta tillstånd

Generaliseringar

Det geometriska centret kan generaliseras från euklidiska utrymmen till allmänna riemannska grenrör (och även metriska utrymmen ) med samma idé som används för att definiera Fréchet-medelvärdet på riemannska grenrör [22] . Låta vara en Riemann grenrör med en avstånd funktion , Låt vara vikter som summan till 1, och låt vara observationer från . Sedan definierar vi det viktade geometriska centrumet (eller det viktade Fréchet-medelvärdet) för datapunkterna

.

Om alla vikter är lika, säger vi vad som är det geometriska centrumet.

Anteckningar

  1. Det mer generella k -medianproblemet frågar om positionen för k -centra som minimerar summan av avstånden från varje punkt i mängden till närmaste centrum.
  2. 1 2 Drezner, Klamroth, Schöbel, Wesolowsky, 2002 .
  3. Cieslik, 2006 .
  4. Lawera, Thompson, 1993 .
  5. 1 2 3 4 Lopuhaä, Rousseeuw, 1991 .
  6. Eiselt, Marianov, 2011 .
  7. Krarup, Vajda, 1997 .
  8. Spanien, 1996 .
  9. Brimberg, 1995 .
  10. 1 2 Bose, Maheshwari, Morin, 2003 .
  11. Wesolowsky, 1993 .
  12. Fekete, Mitchell, Beurer, 2005 .
  13. 1 2 3 Haldane, 1948 .
  14. 12 Vardi, Zhang, 2000 .
  15. Cieslik, 2006 ; Plastry, 2006 . Det konvexa fallet bevisades först av Giovanni Fagnano .
  16. Bajaj, 1986 ; Bajaj, 1988 . Tidigare Cockayne och Melzak Cockayne, Melzak, 1969 bevisade att Steiner-punkten för 5 punkter i planet inte kan konstrueras med en kompass och rätlina
  17. Weiszfeld, 1937 .
  18. Kuhn, 1973 .
  19. Chandrasekaran, Tamir, 1989 .
  20. Nie, Parrilo, Sturmfels, 2008 .
  21. Cohen, Lee, Miller, Pachocki, Sidford, 2016 .
  22. Fletcher, Venkatasubramanian, Joshi, 2009 .

Litteratur