Datamart

Data mart ( eng.  Data Mart ; andra översättningsalternativ: specialiserat datalager, datakiosk, datamarknad) - en delmängd (del) av datalagret , som är en uppsättning tematisk, snävt fokuserad information, inriktad t.ex. användare av en arbetsgrupp eller avdelning [ 1] [2] .

Begreppet data marts

Konceptet med datamarts föreslogs av Forrester Research redan 1991 . Enligt författarna är datamarts  en uppsättning tematiska databaser (DB) som innehåller information relaterad till vissa aspekter av organisationens verksamhet.

Konceptet har ett antal otvivelaktiga fördelar:

Men begreppet datamarts har också mycket allvarliga luckor. I huvudsak förutsätter det implementeringen av ett geografiskt distribuerat informationssystem med liten kontrollerad redundans, men föreslår inte sätt att säkerställa integriteten och konsistensen hos de data som lagras i det.

Blandat koncept av datamarts och datalager

Idén att kombinera de två koncepten - datalager och datamarst, tillhör tydligen M. Demarest, som 1994 föreslog att kombinera de två koncepten och använda datalager som en enda integrerad datakälla för datamarts.

Och idag är det en sådan flernivålösning:

gradvis bli de facto-standarden, vilket möjliggör den mest kompletta implementeringen och användningen av fördelarna med var och en av tillvägagångssätten:

Den relationella formen av datarepresentation som används i den centrala företagsdatabasen ger det mest kompakta sättet att lagra data. Moderna relations-DBMS vet redan hur man arbetar med databaser som har en storlek i storleksordningen flera terabyte. Även om ett sådant centralt system vanligtvis inte kan tillhandahålla ett onlineläge för att bearbeta analytiska frågor, när man använder nya metoder för att indexera och lagra data, såväl som partiell denormalisering av tabeller, handläggningstiden för förreglerade frågor (och reglerade procedurer för att ladda upp data till flerdimensionella databaser kan också betraktas som sådana). ) är helt acceptabelt.

I sin tur ger användningen av flerdimensionell DBMS i noderna på den lägre nivån den minsta bearbetningstiden och svar på ad hoc-användarförfrågningar. Dessutom är det i vissa flerdimensionella DBMS möjligt att lagra data både permanent (direkt i en flerdimensionell databas) och dynamiskt (under en session) ladda data från relationsdatabaser (baserat på reglerade frågor).

Således är det möjligt att permanent lagra endast de data som oftast efterfrågas i en given nod. För alla andra lagras endast beskrivningar av deras struktur och program för avlastning från den centrala databasen. Även om den initiala åtkomsten till sådana virtuella data kan vara ganska långsam i svarstid, ger denna lösning hög flexibilitet och kräver billigare hårdvara.

Se även

Anteckningar

  1. Data Mart är inte lika med Data  Warehouse . Arkiverad från originalet den 20 april 2011.
  2. Fon Silvers. Bygga och underhålla ett datalager . - CRC Press, 2008. - P. 128. - ISBN 978-1-4200-6462-9 .