Netezza

Netezza
Sorts publikt bolag
Börsnotering _ NZ
Bas 2000
avskaffas 2011
Anledning till avskaffande Absorberas av IBM
Efterträdare IBM
Grundare Jitindra Saxena
Foster Hinshaw
Plats  USA :Marlborough,Massachusetts
Industri datavetenskap ( ISIC :) 2620 _
Produkter Hård- och mjukvarukomplex för databehandling
omsättning 190 miljoner dollar (2010)
Antal anställda 469 (2010)
Hemsida netezza.com
 Mediafiler på Wikimedia Commons

Netezza ( urdu نتیجہ ‎, "natija"  - " resultat ") är ett amerikanskt företag som utvecklar hårdvara och mjukvarusystem för datalager - kluster av relationsdatabasservrar som tillhandahåller massivt parallell bearbetning . En utmärkande egenskap hos alla Netezza-komplex är användningen av programmerbara gate-arrayer på databehandlingsnoder, som tillhandahåller datakomprimering och filtrering, och därigenom minskar lagringskostnader och I/O- operationer vid exekvering av datahämtningsförfrågningar [1] .

Företaget grundades 2000, absorberades av IBM 2010 , helt integrerat i företaget sedan 2011 , hård- och mjukvarusystem producerades under varumärket IBM PureData for Analytics under perioden 2012-2014.

Historik

Grundades 2000 ( under dot-com-kraschen ) av den indiska födda entreprenören Jitindra Saxena och Foster Hinshaw med stöd av riskkapitalisten Paul Feri ( Paul Feri ), som senare grundade investeringsbolaget Matrix partners ). Registrerade i augusti 2000 i Delaware under namnet Intelligenta datamotorer och bytte i oktober samma år namn till Netezza. På 1990-talet var Saxena en av grundarna av Applix och ledde det under lång tid (huvudprodukten av Applix är ett flerdimensionellt minnesdatabashanteringssystem TM1 , ägt av IBM Corporation sedan 2008 ), Hinshaw var IT-konsult hos systemintegratören Keane . Saxena tog över som VD för företaget och Hinshaw som teknisk direktör. Företagets huvudkontor och utvecklingsavdelningar genom historien var belägna i städerna Massachusetts : Framingham , Marlborough , Cambridge , representationskontor fanns i 12 länder.

Företaget fokuserade initialt på lanseringen av hård- och mjukvarusystem för datalager som implementerar massiv parallell bearbetning av stora mängder information. År 2002 introducerades Performance Server -hårdvara och mjukvarusystem, vilket gör det möjligt att bearbeta lagringar med en volym på 4,5 - 18 TB [2] . Komplexen monterades i form av färdiga telekommunikationsskåp fyllda med nödvändig server och växlingsutrustning med förinstallerad programvara. Lösningens nyckelfunktion var kombinationen av standard ProLiant -serverbaserad hårdvara med fältprogrammerbara gate array- enheter som ger effektiv lagring och högpresterande databehandling, komprimerad och segmenterad av lagringsnoder. Företaget lovade att avsevärt minska kostnaden för att bearbeta stora relationslagringar för kunden på grund av effektiv lagring och erbjöd komplex till priser från 622 000 USD till 2,5 miljoner USD, beroende på mängden lagring [2] .

Under 2002-2003 levererade företaget de första komplexen till kunder, varav en är administrationen av delstaten Massachusetts [3] . 2003 tilldelades Hinshaw Infroworld magazines pris "Årets innovatör" för utveckling och implementering av Performance Server 8000- komplex [3] .

2003 tjänade företaget 13,5 miljoner dollar, 2004 - 40 miljoner dollar [4] , under de efterföljande åren av dess existens var den årliga ökningen av intäkterna cirka 50 % [5] [6] (även om Saxena 2005 förväntade sig en tillväxt på 150 % [7] ). Bland 2004 års kunder finns AT&T Wireless och den brittiska divisionen av Orange Corporation [8] , medan Orange är listad som en av Netezzas investerare [9] .

2006 lyckades företaget sälja 200 komplex och tjänade cirka 80 miljoner dollar på ett år, och så stora företag och organisationer som Amazon.com , amerikanska Röda Korset , AOL [5] dök upp bland kunderna , företaget avslutade året med en nettoförlust på 14 miljoner USD [6] . I juli 2007 genomförde Netezza ett börsnoterat erbjudandeNew York Stock Exchange , bedömt som framgångsrikt (värdet på aktierna ökade med 45 % under placeringsperioden) [6] , tills avskaffandet av bolagets aktier handlades under tickersymbolen NZ . _

I början av 2009 lämnade Saxena företaget, Jim Baum , som tidigare ledde Boston-företaget Endeca (övertogs av Oracle 2011), ledde Netezza. Från och med 2010 har mer än 500 organisationer rapporterats som använder Netezza-system [10] .

I september 2010 tillkännagavs företagets övertagande av IBM för 1,7 miljarder dollar [11] . Under 2011 genomfördes integration i företaget, från och med den tiden distribueras all Netezza hård- och mjukvarusystem genom distributionskanalerna för IBM-programvara, ordet "Netezza" användes i namnet på komplexen under de första två åren , sedan slutet av 2012 - endast som ett egennamn för databehandlingsteknik . Sedan 2014 har lanseringen av nya komplex baserade på Netezza-teknologier avbrutits, och sedan mitten av 2019 har teknisk support för den sålda utrustningen upphört [12] . År 2020, under varumärket "Netezza" från IBM, tillhandahölls ett molnbaserat DBMS , kompatibelt med nedlagda hård- och mjukvarusystem , genom prenumeration från molnen av IBM Cloud eller Amazon Web Services [13] .

Marknadsposition

På 1980-talet producerades specialiserade hård- och mjukvarusystem för distribuerad databehandling av Britton Lee och Teradata ( 1990 absorberade Teradata Britton Lee) [14] , och de prioriteras i tillvägagångssättet för en sådan implementering av stora bearbetningar. mängder data. Det är dock uppkomsten av Netezza-komplex i början av 2000-talet som noteras som identifieringen av marknaden för sådana system [15] . Dessutom är själva konceptet med specialiserade hård- och mjukvarusystem för datalager ( engelsk  data warehouse appliances ) associerat med Netezza CTO Foster Hinshaw [16] .

Från och med 2004, när företaget släppte sviter som kan hantera upp till 27 TB lagring, jämfördes Netezzas lösning med både Teradata-sviter och icke-specialiserade system baserade på Oracle och IBM -programvara ; vid den tiden kunde Teradata-komplex bearbeta hundratals terabyte och kritik från en konkurrent baserades på svårigheten att uppgradera systemet från Netezza i händelse av en snabb ökning av lagringsvolymer [17] .

Under 2006-2007 hänvisade Gartner Netezza till gruppen av "visionärer" på marknaden för datalagringslösningar inom ramen för den " magiska kvadranten " som sammanställs årligen för detta segment [18] , sedan 2008 har Netezza flyttats till marknadsledarna kvadrant. 2010 års Magic Quadrant lyfter fram Netezza som en direkt konkurrent till Oracle Exadata [10] .

Prestandaserver

Performance Server-komplexet producerades 2002 och kompletterades med en serie kontrollnoder, bearbetningsnoder baserade på Hewlett-Packard ProLiant-servrar , utrustade med fältprogrammerbara gate array- beräkningsenheter som ansvarar för att interagera med lagringsnoder. Bearbetningsnoderna fungerade under operativsystemet Red Hat Enterprise Linux och PostgreSQL- databashanteringssystemet [2] . Lösningen är implementerad i en delad - ingenting-arkitektur , så datalagerdesignern var tvungen att definiera splittringsnycklar för att fördela den bearbetade databasen över noder relativt jämnt . 

De första komplexen behandlade upp till 18 TB till ett pris av $2,5 miljoner (cirka $140 000 per terabyte). Den äldre modellen av 2004 behandlade lagringar upp till 27 TB i storlek och var utrustad med 650 diskar och 676 processorer ; 370 000 $. Juniorkomplexet 2004 bearbetade 400 GB, innehöll 60 processorer och kostade 300 000 $ [20] (cirka 770 000 $ i termer av terabyte).

Tvillingfena

De första TwinFin-komplexen använde databearbetningsnoder baserade på Power -arkitekturprocessorer , som levererades av en av IBM OEM- partners [21] och, som i Performance Server, var utrustade med specialiserade bearbetningsnoder baserade på programmerbara gate-arrayer. I augusti 2009 ersattes bearbetningsnoderna med IBM-bladservrar med två socklar med Intel Xeon-processorer , fältprogrammerbara gate-arrayer installerades en för varje Xeon-kärna [22] , dessa noder placerades i en standardbladkorg för IBM BladeCenter. Tack vare övergången till x86-64-arkitekturen var det möjligt att avsevärt minska kostnaden för en terabyte data för lagring - till ett belopp under $20 000. [23] PostgreSQL som används i TwinFin beskrivs som "kraftigt modifierad" [24] .

Under de första åren efter övertagandet fortsatte IBM Corporation att utveckla komplexen. De viktigaste ändringarna gällde införandet av olika mjukvarutekniker för " big data ": möjligheten till MapReduce- bearbetning i databasen lades till genom integrationen av Hadoop , statistisk bearbetning implementerades med SPSS och R direkt på klusternoderna. I kölvattnet av rapporter om integrationen av det statistiska paketet Revolution R i lösningen, som ursprungligen användes för praktisk analys över relationella datalager, karakteriserades komplexet i en av publikationerna som " Frankenstein for big data" [25] . 2011 döptes TwinFin om till IBM Netezza 1000, flera konfigurationer av komplexet producerades med antalet utdrag (par från bearbetningsnoden och programmerbar gate-array) från 3 till 12 per skåp och lagringskapacitet på 8 till 32 TB per skåp , att kombinera upp till 10 skåp stöds. Vikten på ett komplett skåp är ca 900 kg, energiförbrukningen är ca. 7,5 kW. Kostnaden för ett komplett skåp från partners i USA var ca. 320 000 $ [26] (cirka 10 000 $ per terabyte). För utvecklings- och testsyften levererades IBM Netezza 100-komplex, tidigare Skimmer (1 kontrollnod och 1 kodavsnitt per 2,8 TB). Dessutom lade IBM till IBM Netezza High Capacity Appliance-komplexet till raden (två eller fyra skåp med 8 eller 16 utdrag för 288 respektive 576 TB).

I oktober 2012 bytte IBM om varumärket och från det ögonblicket fram till avvecklingen i mitten av 2010-talet levererades komplexen under varumärket "PureData for Analytics" som en del av PureSystems- linjen [27] , material om komplexen använder undertiteln "baserat på Netezza-teknik" [28] , utseendet på skåpen har ändrats avsevärt. Under N1001-indexet tillhandahölls komplex med 4, 7 och 14 snipps per skåp och 32, 64 respektive 128 TB lagringskapacitet, vilket fortsätter logiken i Netezza 1000-linjen, kostnaden för ett komplett skåp från partners i USA i början av 2013 var cirka 360 tusen dollar [29] Under N2001-indexet släpptes högkapacitetskomplex med 4–7 snippar och 96–192 TB per skåp, 2014, som en fortsättning på denna linje, N3001 komplex med 2–7 kodavsnitt och upp till 192 TB per skåp släpptes, i jämförelse med den tidigare versionen ökades antalet kärnor på kodavsnittet (20 kärnor på bearbetningsnoden och 16 kärnor på den fältprogrammerbara gate-arrayen, i motsats till åtta kärnor på var och en av komponenterna i kodavsnittet tidigare).

Kritik

Netezza anklagades för att olagligt använda ett Massachusetts-baserat IISi (Intelligent Integration Systems) geospatialt paket medan han fullföljde en order från CIA att skapa hårdvaran och mjukvaran för drönaren MQ -1 Predator . Kärnan i problemet var att Netezza, efter att ha fått ett avslag från IISi i kravet att påskynda porteringen av paketet under TwinFin, hackade testversionen av paketet och integrerade det självständigt i sin hårdvaru- och mjukvarumiljö. Det noterades särskilt att CIA var medveten om hacket, och kunden var medveten om att avvikelser i platsuppskattningar i testversionen nådde 13 meter (jämfört med den stabila versionen, där det inte fanns några sådana avvikelser), och detta kunde leda till onödiga offer under stridstillämpning av teknik [30] . Men i november 2010 avgjordes anspråken utanför domstol [31] .

Anteckningar

  1. Prickett-Morgan, 2010 , Den speciella såsen i Netezza-växeln är en fältprogrammerbar gate array (FPGA) som hanterar datakomprimering och dekompression när den går på och av disken, och därigenom snabbar upp genomströmningen, samt ger sofistikerad datafiltrering så att endast de relevanta delarna av en gigantisk datamängd skickas vidare till X64-motorerna för att köra SQL-frågan.
  2. 1 2 3 Whiting, Rick startar Netezza driver rabatterade datalagerprodukter. Företaget lovar apparater som det säger kan hantera terabyte-skala business intelligence-appar 10 till 20 gånger snabbare än traditionella system till halva  kostnaden . informationsvecka . UBM TechWeb (23 september 2002). Hämtad 11 juli 2012. Arkiverad från originalet 12 januari 2013.
  3. 1 2 Rash, Wayne 2003 InfoWorld Innovator: Foster D. Hinshaw.  Netezza CTO använde aerodynamik för att uppfinna en storskalig databasanordning som hanterar data på ett helt nytt sätt . Inforworld (23 mars 2003). - "Några av de största organisationerna, inklusive Commonwealth of Massachusetts, fann att BI (business intelligence) inte var så användbart om det inte kunde hantera all deras data." Hämtad 8 juli 2012. Arkiverad från originalet 25 september 2012.
  4. Lyons, 2004 , Jitendra Saxenas lilla datorföretag, Netezza, kommer att sälja totalt 40 miljoner dollar i år.
  5. 12 Netezza Corporation. Börsintroduktion  . _ Edgar, Form S-1 . United States Securities and Exchange Commission (22 mars 2007). Hämtad 8 juli 2012. Arkiverad från originalet 25 september 2012.
  6. 1 2 3 Vance, Ashley Netezza tjänar massor av kontanter i IPO  . Registret (21 juli 2007). Hämtad 8 juli 2012. Arkiverad från originalet 25 september 2012.
  7. Lyons, 2004 , Saxena förväntar sig att hans försäljning kommer att växa med 150 % under 2005, till 100 miljoner dollar.
  8. Lyons, 2004 , AT&T Wireless och Orange UK valde Netezza-boxar för att analysera kundsamtal.
  9. Lyons, 2004 , Orange är också en investerare i Netezza.
  10. 1 2 Feinberg, Donald; Beyer, Mark A. Magic Quadrant for Data Warehouse Database Management Systems  . Magisk kvadrant . Gartner (28 januari 2011). — “Förvärvet av Netezza i slutet av 2010 ger IBM en färdig Linux-kompatibel datalagerenhet, som konkurrerar direkt med Oracles Exadata. Vidare indikerar samtal med Gartner-kunder att Netezza fortsätter att konkurrera väl på både pris och prestanda mot Oracles Exadata." Hämtad 11 juli 2012. Arkiverad från originalet 25 september 2012.
  11. Nutall, Chris . IBM köper Netezza för 1,7 miljarder dollar i kontanter  (engelska) (HTML), Financial Times  (20 september 2010). Hämtad 8 juli 2012.
  12. Max Smolaks. RIP Netezza, IBM:s FPGA-drivna datalagerdröm . En gång mäktiga företag dödade av cloud computing . Registret (3 juli 2019) .
  13. Lindsay Clark. IBM återupplivar Netezza data warehousing-kit i molnet, vilket kommer att glädja kunder mitt i migreringen . Registret (27 maj 2020).
  14. Chernyak, Leonid. Big Data — Ny teori och praktik  // Öppna system. DBMS . - 2011. - Nr 10 . — ISSN 1028-7493 .
  15. Ponya, 2010 , Generellt sett betraktades Terradatas kärnproduktlinje som moder till alla datalagerapparater, även om termen inte var förknippad med produktutbud. Det ökade intresset för apparater för datalager ökade i och med att Netezza uppstod i början av 2000-talet.
  16. Ponya, 2010 , Termen datalagerapparat myntades av Foster Hinshow.
  17. Lyons, 2004 , chefer på Teradata avfärdar Netezza och säger att dess lådor är svåra att uppgradera och för ynkliga för att hantera enorma datalager som de som de har byggt för Wal-Mart, FedEx och Dell. Teradata-system kan hantera hundratals terabyte.
  18. Beasty, Colin Teradata toppar Gartners magiska kvadrant för databashantering  . Destination CRM . CRM Magazine (26 oktober 2007). — “Netezza, som var praktiskt taget oförändrad från sitt tidigare betyg; i år släpar företaget bara något efter Sybase i sin förmåga att genomföra, men gnisslar förbi när det gäller fullständigheten i sin vision.” Hämtad 11 juli 2012. Arkiverad från originalet 25 september 2012.
  19. Lyons, 2004 , Netezzas toppmodell har 650 hårddiskar och 676 mikroprocessorer. Den rymmer 27 terabyte data och kostar 10 miljoner dollar.
  20. Lyons, 2004 , Den billigare modellen, till $300 000, använder 60 mikroprocessorer och rymmer 400 gigabyte.
  21. Prickett-Morgan, 2011 , De ursprungliga Netezza-apparaterna var baserade på Power-arkitektur (och kom inte från IBM, utan en av dess OEMs).
  22. Prickett-Morgan, 2010 , IBM:s BladeCenter-chassi och HS22 Xeon-bladservrar med två socklar och plunking av FPGA:erna (en per Xeon-kärna) på ett medföljande blad.
  23. Monash, Kurt Netezza ändrar sin hårdvaruarkitektur och sänker priserna därefter  . Monash Research (30 juli 2009). Hämtad: 13 juli 2012.
  24. Prickett-Morgan, 2010 , … kraftigt anpassad PostgreSQL-databas.
  25. Harris, Derrick . IBM skapar Big Data Frankenstein med Netezza-R Fusion  (engelska) , The New York Times  (2011-03-141). Hämtad 19 november 2011.
  26. Netezza 1000-12  . Tvillingarna (13 juli 2012). Hämtad 13 juli 2012. Arkiverad från originalet 25 september 2012.
  27. Pricket Morgan, Timothy. IBM tar sig an Oracle med PureData-enheter.  Rebadging Netezza lager och Smartie lådor . Th Register (10 oktober 2012). Tillträdesdatum: 16 februari 2013. Arkiverad från originalet 14 mars 2013.
  28. Drivs av Netezza-teknologi
  29. PureData System Analytics N1001-015  . Tvillingarna (16 februari 2013). Tillträdesdatum: 16 februari 2013. Arkiverad från originalet 14 mars 2013.
  30. Williams, Christopher CIA använde "olaglig, felaktig kod för att rikta in sig på dödsdrönare". "De vill döda människor med programvara som inte fungerar"  (engelska) . Registret (24 oktober 2010). Hämtad 11 juli 2012. Arkiverad från originalet 25 september 2012.
  31. Williams, Christopher Netezza betalar för att stänga av CIA-rättegången för drönare. Felaktig inriktningsrad  tystad . Registret (11 november 2010). Hämtad 11 juli 2012. Arkiverad från originalet 25 september 2012.

Litteratur