Kolumnlagring är ett sätt att organisera lagring i databaser , när data inte lagras rad för rad (rad för rad), utan kolumn för kolumn. Det är mest effektivt för datavalsoperationer från en liten delmängd av kolumner med efterföljande kolumn-för-kolumn-bearbetning, såväl som för datakomprimering (eftersom kolumner ofta lagrar dubbletter eller stängda data). Att infoga ett stort antal rader kan implementeras effektivt, men enstaka infogning, uppdatering och radering är mindre effektiva i kolumnlagring än i radlagring.
Columnar DBMS är ett databashanteringssystem som stöder kolumnär lagring. Traditionella relationella DBMS :er använder vanligtvis radlagring, vilket är effektivt för OLTP- scenarier, medan kolumnlagring för OLAP- arbetsbelastningar tenderar att ge bättre prestanda.
Relationskolumnära DBMS inkluderar Teradata Database , Netezza , Sybase IQ , kdb , C-Store (och dess ättling Vertica ), Greenplum , Hana , ParAccel (och dess ättling Amazon Redshift ), MonetDB , ClickHouse . Ett antal traditionella relations-DBMS implementerar kolumnär lagring ( Oracle Database , MS SQL Server , MariaDB ), eller så finns det tillägg (till exempel Citus för PostgreSQL ). De huvudsakliga Hadoop-formaten - RCFIle , ORC , Parquet , Apache Arrow - använder också kolumnär organisation. Columnar DBMS är ett antal system fokuserade på att arbeta med tidsserier ( InfluxDB , Apache Druid ).
Databas | |
---|---|
Begrepp |
|
Objekt |
|
Nycklar | |
SQL |
|
Komponenter |