Topologisk dataanalys är ett nytt område av teoretisk forskning för datautvinning och datorseendeproblem .
Huvudfrågor:
Den mänskliga hjärnan bygger lätt en uppfattning om den allmänna strukturen från speciella lågdimensionella data. Det är till exempel inte svårt för honom att få den tredimensionella formen av ett föremål från platta bilder i varje öga. Skapandet av en gemensam struktur utförs också genom att kombinera fragment som är diskreta i tid till en kontinuerlig bild. Så till exempel är en tv-bild tekniskt sett en rad individuella punkter, som dock uppfattas som en enda scen.
Den huvudsakliga metoden för topologisk dataanalys:
Uppgifterna representeras ofta av en uppsättning punkter i det euklidiska rummet En , vars form återspeglar det fenomen som beskrivs av data.
Verkliga tredimensionella objekt kan representeras som ett moln av punkter . Till exempel är enskilda punkter markerade med en laser, och deras ostrukturerade uppsättning fungerar som en datorrepresentation av objektet. Ett punktmoln är vilken som helst (möjligen bullrig) uppsättning punkter i E n eller projektioner av punkter i en lägre dimension.
Inom datorgrafik och statistik finns det olika metoder för att konstruera förbilder från projektioner. Topologisk dataanalys är designad för högdimensionella utrymmen eller utrymmen som är för böjda för att kunna skapa platta projektioner från dem.
För att omvandla ett moln av punkter i ett metriskt utrymme till ett integrerat objekt, används punkterna som hörn på grafen , vars kanter är tilldelade avstånd, sedan förvandlas grafen till ett enkelt komplex och studeras med hjälp av algebraisk topologi.