Apache Cassandra

Apache Cassandra
Sorts NoSQL
Författare Avinash Lakshman [d] och Prashant Malik [d]
Utvecklaren Apache Software Foundation
Skrivet i Java [1]
Första upplagan 2008 och 10 april 2012 [1]
senaste versionen
Licens Apache-licens 2.0
Hemsida cassandra.apache.org
 Mediafiler på Wikimedia Commons

Apache Cassandra  är ett distribuerat databashanteringssystem som tillhör klassen av NoSQL - system och är designat för att skapa mycket skalbara och pålitliga lagringar av enorma datamatriser representerade som en hash.

Initialt utvecklades projektet i inälvorna av Facebook och 2009 överfördes under Apache Software Foundations vingar , denna organisation fortsätter att utveckla projektet. Industriella lösningar baserade på Cassandra har distribuerats för att tillhandahålla tjänster till företag som Cisco , IBM , Cloudkick , Reddit , Digg , Rackspace , Huawei , Netflix , Apple , Instagram , GitHub , Twitter och Spotify . År 2011 hade det största serverklustret som betjänade en enda databas som hanteras av Cassandra mer än 400 maskiner och innehöll mer än 300 TB data [3] .

Den är skriven i Java och implementerar ett distribuerat hashsystem som liknar DynamoDB , vilket ger nästan linjär skalbarhet med ökande datavolym. Den använder en datalagringsmodell baserad på en familj av kolumner , som skiljer sig från system som MemcacheDB , som lagrar data endast i ett nyckel-värdepar , genom möjligheten att lagra hash med flera nivåer av kapsling. Tillhör kategorin feltolerant DBMS: data som placeras i databasen replikeras automatiskt till flera noder i ett distribuerat nätverk eller till och med jämnt fördelat i flera datacenter. När en nod misslyckas, plockas dess funktioner upp i farten av andra noder, nya noder läggs till i klustret och uppdatering av Cassandra-versionen görs direkt, utan ytterligare manuell intervention och omkonfigurering av andra noder. Det rekommenderas dock starkt att återskapa nycklar (etiketter) för varje nod, inklusive befintliga, för att bevara kvaliteten på lastbalanseringen. Nyckelgenerering för befintliga noder kan undvikas i fallet med en multipel ökning av antalet noder (2 gånger, 3 gånger, och så vidare).

CQL

För att förenkla interaktionen med databasen stöds det strukturerade frågespråket CQL (Cassandra Query Language), vilket liknar SQL , men avsevärt reducerat i funktionalitet. Du kan till exempel endast utföra de enklaste frågorna SELECTmed ett urval enligt ett visst villkor. Tillägg och uppdatering utförs genom ett enda uttryck UPDATE, det finns ingen operation INSERT(om det inte finns någon post UPDATEskapas den under körningen - SQL-satsens semantik används MERGE). Av de utmärkande särdragen - stöd för namnutrymmen och kolumnfamiljer, skapandet av index genom uttrycket " CREATE INDEX". CQL-aktiverade drivrutiner implementerade för Python (DBAPI2), Java ( JDBC ), Ruby ( gem cassandra-cql ), PHP ( Thrift , cassandra-pdo , Cassandra-PHP-Client-Library ), JavaScript ( Node.js ) och Perl ( DBD::Cassandra ).

Dessutom är CQL implementerat i Scylla DBMS , som arkitektoniskt och språkligt liknar Cassandra-systemet, men skrivet i C++ för att förbättra prestandan.

Anteckningar

  1. 1 2 https://projects.apache.org/json/projects/cassandra.json
  2. https://github.com/apache/cassandra/releases/tag/cassandra-4.0.7
  3. Apache Cassandra 1.0 databasversion . Datum för åtkomst: 14 januari 2012. Arkiverad från originalet den 23 oktober 2011.

Länkar

Litteratur