OLAP kub

OLAP-kub  - ( O n -Line A nalytical Processing - interaktiv dataanalys ) en flerdimensionell datamatris , vanligtvis sparsam och långtidslagrad, som används i OLAP . Det kan implementeras på basis av universell relations-DBMS eller specialiserad programvara .

Matrisindex motsvarar dimensioner (dimensioner) eller axlar för kuben, och värden för matriselement motsvarar mått (mått) på kuben.

w  : ( x , y , z ) → w xyz ,

där x , y , z  är mått, w  är ett mått.

Till skillnad från en vanlig array i ett programmeringsspråk kan åtkomst till elementen i en OLAP-kub utföras både av hela uppsättningen av indexdimensioner och av deras delmängd. Då blir resultatet inte ett element, utan en uppsättning av dem, vilket är ett argument för aggregeringsfunktionen [1] :

W  : ( x , y ) → W = { w z1 , w z2 , …, w zn }

Även känd är beskrivningen av en OLAP-kub som använder terminologin för relationalgebra, som en projektion av relationer .

Givet ett samband av ordning N, betrakta en projektion med dimensionerna X , Y och Z som nyckel och W som deltaattribut. Detta kännetecknas av funktionen:

W  : ( X , Y , Z ) → W ,

vars attribut ( X , Y och Z ) motsvarar kubaxeln , och W- värdena för varje möjliga trippel ( (X, Y, Z) ) motsvarar data för varje cell i kuben.

Eftersom tvådimensionella utgångsenheter inte kan adressera tre dimensioner är det mer praktiskt att projicera "skivor" av en kub (projektion används i betydelsen att minska antalet dimensioner av en matris - en kub), kanske i formen

W  : ( X , Y ) → W

Den här projektionen har ingen primärnyckel . Således är funktionens tvetydighet möjlig. Skärningen av den ternära funktionella representationen med ett visst värde på Z är emellertid mycket viktig.

Anledningen till att presentera data som OLAP är den utbredda användningen av paradigmet för flikrapporter (eller PivotTable ). Användare vill se data presenterade som sidor där (nästan som en kalkylbladsredigerare ) den översta raden är fylld med X -värden; värden Y  - kolumnen längst till vänster; och värdena W : (X, Y) -> W fyller i resten av tabellen. Det är också möjligt att använda DML från traditionell SQL för att visa trippel (X, Y, W) , även om detta inte är ett lika bekvämt format som en flikrapport, eftersom DML-representationen kräver en linjär sökning genom listan över det önskade paret ( X, Y) , och för personsökning behöver du hitta skärningspunkten mellan kolumn X och rad Y

Språket MDX (Multidimensional Expressions) utvecklades som ett lättviktigt verktyg för att representera OLAP. Det är möjligt att konvertera vissa frågor till traditionell SQL, även om det ofta är nödvändigt att använda stora frågor med många komplexa strukturer. De flesta OLAP-leverantörer stöder MDX.

Anteckningar

  1. Tarasov S. V. DBMS för programmeraren. Databaser från insidan. — M.: SOLON-Press, 2015. — 320 sid. - ISBN 978-2-7466-7383-0 .

Litteratur

Se även