Cloudera

Cloudera Inc.
Sorts publikt bolag
Börsnotering _ NYSE : CLDR
Bas 2009
Grundare Christophe Biscilla,
Amr Awadalla,
Jeffrey Hammerbacher,
Michael Olson
Plats  USA :Palo Alto
Nyckelfigurer Reilly, Tom (VD),
Doug Cutting (chefsarkitekt)
Industri mjukvaruutveckling ( ISIC :) 6201 _
Produkter Kommersiell version av Hadoop , Cloudera Impala
omsättning 301 miljoner USD (2018)
Rörelseresultat ▼ −389 miljoner USD (förlust, 2018)
Nettoförtjänst ▼ −386 miljoner USD (förlust, 2018)
Kapitalisering 2,66 miljarder USD (7 september 2018) [1]
Hemsida cloudera.com
 Mediafiler på Wikimedia Commons

Cloudera  är ett amerikanskt företag som utvecklar Apache Hadoop- distributioner och ett antal Hadoop ekosystemprogramvaruprodukter .

Företagets affärsmodell har jämförts med Red Hats verksamhet  - Cloudera skapar distributioner av mjukvaruprodukter för organisationer baserade på fri mjukvara och gör vinst genom att tillhandahålla teknisk support för de levererade lösningarna [2] [3] . Med uppsvinget inom " big data "-teknologier har Cloudera upprepade gånger erkänts som ett av de mest lovande företagen som kan lösa problem i sin klass [4] [5] .

Under 2018 absorberade det huvudkonkurrenten på Hadoop-distributionsmarknaden, det amerikanska företaget Hortonworks .

Historik

Företaget grundades i oktober 2008 i Burlingame ( Kalifornien ) med ett startkapital på 5 miljoner dollar, huvudmålet för verksamheten var kommersialiseringen av Hadoop- projektet . Grundarna av företaget är Christophe Bischiglia ,  som tidigare arbetat på Google , Amr Awadallah ( Amr Awadallah , Vice President för Yahoo Corporation , ansvarig för analyssystem och datalagring), Jeffrey Hammerbacher ( Jeff Hammerbacher , Hive- projektledare på Facebook ) och Michael Olson , vice vd för Oracle Corporation , tidigare VD för Sleepecat , som utvecklade och utvecklade Berkeley DB och absorberades 2006 av Oracle) [6] . Hammerbacher ordnade startfinansiering för projektet från Accel Partners , där Olson tog över företaget. Totalt samlades 11 miljoner dollar in i det inledande skedet, och förutom Accel finns Greylock Partners och affärsänglarna Gideon Yu och Caterina Fake listade bland investerarna [ 7 ] .

Bland de anställda som anställdes under de första månaderna fanns Hadoop-skaparna Doug Cutting och  Mike Cafarella , tidigare VD:ar för VMware ( Diane Green ) och MySQL AB ( Marten Mikos ) [8] . Tack vare Cuttings flytt till Cloudera har företaget beskrivits som "den nya flaggbäraren av Hadoop" [9] .

2009 rankades Biscilla på femte plats på Businessweeks topp 22 lista över unga tekniska entreprenörer [10] och Hammerbacher rankades sjua (av 15) 2010 . I Biscilla-nomineringen beskrevs Cloudera som ett tjänsteföretag som tillhandahåller teknisk rådgivning om Hadoop, medan Hammerbachers bidrag 2010 noterades som en förändring av företagets verksamhet, vilket gjorde det till en leverantör av replikerbar programvara för organisationer [11] .

I november 2011 fick företaget ytterligare finansiering till ett belopp av 40 miljoner dollar [12] , i december 2012 - ytterligare 65 miljoner dollar [13] , bland investerarna i de kommande omgångarna finns Ignition Partners , Greylock , Accel , Meritech Capital Partners och In -Q-Tel [ 14] [13] .

I oktober 2012 introducerade företaget Impala -produkten , som ger SQL -åtkomst till data i ett Hadoop-drivet kluster, uppkomsten av en sådan produkt välkomnades som en överraskning, eftersom företagens rådande retorik fokuserade på "big data". "-teknologier var övergivandet av traditionella teknologier baserade på SQL ( eng.  old SQL , i samklang med " old school " - old school ) [15] .

I juni 2013 blev Tom Reilly inbjuden till VD - posten , efter att tidigare ha lett två teknikföretag till övertagande av stora aktörer ( MDM-systemtillverkaren Trigo köptes av IBM 2004, och ArcSight togs till börsintroduktion och absorberades snart av Hewlett-Packard 2010) bedöms evenemanget som förberedelse för antingen ett börsnoterat erbjudande eller en försäljning av verksamheten [16] . Olson flyttade till posten som strategisk direktör och styrelseordförande. I juli 2013 tog företaget över det brittiska företaget Myrryx , grundat av Sean Owen , en av huvudförfattarna till Hadoop-ekosystemets skalbara ramverk för maskininlärning Apache Mahout , Owen tillkännagavs som "Director of Data Science " ( Engelsk direktör för datavetenskap ) [17] .  

I mitten av 2013 fick företaget totalt 141 miljoner dollar i fem investeringsrundor [16] , och i nästa omgång i mars 2014 samlade företaget in ytterligare 160 miljoner dollar [18] . I mars 2014, efter den sjätte investeringsrundan, förvärvade Intel en andel på 18 % i företaget för 740 miljoner dollar och värderade därmed Clouderas verksamhet till cirka 4 miljarder dollar [19] ; samtidigt övergav Intel utvecklingen av sin egen Hadoop-distribution som skapades ett år tidigare till förmån för att marknadsföra lösningar från Cloudera [18] . I juni 2014 förvärvade företaget datakrypteringsteknikutvecklaren Gazzang [20] .

I april 2017 höll företaget ett börsnoterat erbjudande på New York Stock Exchange , som ett resultat av vilket det tog in 215 miljoner dollar [21] . Hösten 2017 togs det New York-baserade maskininlärningsföretaget Fast Forward Labs över, affären noterades som ett svar på den snäva integrationen av Hortonworks med IBM, som betonar utvecklingen av artificiell intelligens inom Watson- programmet , och övergav sin Hadoop-distribution till förmån för Hortonworks [22] .

I oktober 2018 tillkännagavs en fusion med Hortonworks, medan strukturen behöll Cloudera-namnet, notering på börsen och VD, och Hortonworks aktieägare fick 40 % av aktierna i det sammanslagna bolaget [23] . Transaktionen slutfördes den 3 januari 2019, trots den totala värderingen av de två företagen vid tidpunkten för tillkännagivandet till 5,2 miljarder dollar, efter dess slutförande uppgick kapitaliseringen av den kombinerade verksamheten till cirka 3 miljarder dollar [24] . Övertagandet fullbordade faktiskt stadiet av konsolidering på marknaden för kommersiella distributioner av Hadoop (av alla anmärkningsvärda andra marknadsaktörer återstod endast MapR med en årlig omsättning på cirka 175 miljoner USD 2018), vilket flyttade fokus för konkurrensen till bredare segment - Big data-verktyg och analytiska plattformar [25] .

I slutet av 2020 köpte företaget tillbaka aktier från Intel för 314 miljoner dollar (426 miljoner dollar mindre än 2014 års investering) [26] .

CDH

CDH ( Clouderas  distribution inklusive Apache Hadoop ) är en Apache Hadoop-distribution som inkluderar ett antal relaterade program och bibliotek och Clouderas egna utvecklingsverktyg, fritt distribuerade och kommersiellt stödda för vissa Linux-distributioner ( Red Hat Enterprise Linux , CentOS , Ubuntu , SuSE SLES , Debian ). Bland Apache-programvaruprojekten relaterade till Hadoop inkluderar distributionen: Flume , HBase , Hive , Mahout , Oozie , Pig , Sqoop , Whirr , Zookeeper . Dessutom inkluderar distributionen sitt eget klusterhanteringsundersystem Cloudera Manager , som inkluderar skript för att distribuera Hadoop-infrastrukturen både i lokala och molnmiljöer ( Rackspace , Amazon EC2 , Softlayer ), samt verktyg och konfigurationer för att stödja byggautomation med Apache Maven .

I början av 2012 skickades två versioner av CDH, CDH2 (baserad på Hadoop 0.20.1) och CDH3 (baserad på Hadoop 0.20.2). CDH3-distributionen ingår i leveransen av Oracle Big Data-apparaten [27] hård- och mjukvarukomplex , dessutom tillhandahålls den första raden av kundsupport för Hadoop av Oracle Corporation , och Cloudera tillhandahåller teknisk support för mer komplexa problem. I mitten av 2012 släpptes en version av CDH4 baserad på Hadoop 2.0 (inklusive YARN- modulen ), tre av företagets egna produkter ingår också i CDH4 - Hue (webbläsargränssnitt för att hantera ett Hadoop-kluster), Impala och Sök (fulltext och facetterad sökning i HDFS- och HBase- miljöer ). 2014 släpptes CDH5-versionen; CDH6-versionen, som släpptes våren 2018, är baserad på Hadoop 3.0 (vars nyckelinnovation var stöd för felkorrigerande kodning för HDFS, vilket avsevärt kan minska den fysiska storleken på kluster) [28] .

Impala

Cloudera Impala  är en massivt parallell SQL -frågemotorför data lagrad i HDFS och HBase , distribuerad under Apache 2.0 -licensen. Till skillnad från Hive , som översätter frågor på ett SQL-liknande språk (HiveQL) till MapReduce-jobb som körs i batch-läge, kör Impala frågor i en distribuerad miljö interaktivt och distribuerar frågan mellan bearbetningsnoder baserat på sin egen mekanism, utan att tillgripa MapReduce.

Cloudera Manager

Cloudera Manager  är en specialiserad komponent som låter dig automatisera skapandet och modifieringen av Hadoop-miljöer, spåra och analysera effektiviteten av bearbetningsuppgifter, ställa in varningar om förekomsten av vissa händelser relaterade till driften av den distribuerade bearbetningsinfrastrukturen. Den årliga kostnaden för teknisk support är cirka 4 000 USD per klusternod [29] . Det finns en gratisutgåva för Cloudera Manager ( engelsk  gratisutgåva ), som endast fungerar på kluster som består av mindre än 50 noder och som saknar ett antal funktioner tillgängliga för kommersiella prenumeranter (såsom prestandaövervakning, konfigurationsversion, Kerberos-stöd ).

Tematiska produkter

Efter Garnters förutsägelse i 2017 års datahanteringsteknologihypecykel att själva konceptet med en "Hadoop-distribution" snart kommer att bli föråldrat, har företaget flyttat sitt produktutbud till tematiska kit, som består av praktiskt taget samma komponenter som är monterade i CDH, men syftar till vissa specifika uppgifter. Så under 2018 dök produkter upp under namnen Data Warehouse (montering för datalager , med fokus på Impala), Operational DB (för operationella databaser, kring HBase , Kudu och Spark ), Data Engineering (för ETL och interaktiva tillgång till data), Data Science (för " data science "-uppgifter ), Enterprise Data Hub (för dataplattformar på företagsnivå - i själva verket en komplett sammansättning av Hadoop-distributionen plus en datakatalog baserad på dess egen SDX-komponent).

Sedan 2018 har prispolicyn utformats kring tematiska produkter; Beroende på konfigurationen betalar prenumeranter årligen från 4 000 USD för att stödja varje produktnod för Data Engineering och Data Science till 10 000 USD för en Enterprise Data Hub-produktnod.

Anteckningar

  1. Cloudera Inc. Morgonstjärna (7 september 2018). Arkiverad från originalet den 7 september 2018.
  2. Malik, 2009 , jag ser några intressanta paralleller mellan Hadoop och Red Hat, som blev framträdande på baksidan av Red Hat Linux, en version av Linux optimerad för företagsanvändare.
  3. Rao, 2011 , Cloudera hjälper till att distribuera Hadoop och tillhandahåller praktiska tjänster kring tekniken, liknande vad Red Hat gör för Linux-ramverket.
  4. Nairn, 2010 , Lagringsjätten EMC har slagit sig ihop med Cloudera, en specialist på databasprogramvara, för att skapa tekniker för att bättre stödja "big data" ... Startup Cloudera använder programvaran Hadoop med öppen källkod för att analysera mycket stora uppsättningar data.
  5. Vance, 2011 , "Det kommer att vara killar som Jeff som förstår vad de ska göra med big data".
  6. Prickett-Morgan, 2009 , ...Christophe Bisciglia, som ledde partnerskapet mellan Google, IBM och National Science Foundation för att skapa Hadoop-rutnät för akademiker att leka med; Amr Awadallah, en tidigare Yahoos vice VD för teknik som ledde datalagrings- och analysarbetet bakom företagets post-, sök-, finans- och nyhetstjänster; - Mike Olson, tidigare verkställande direktör för databastillverkaren Sleepycat Software med öppen källkod (nu ägs av Oracle); och Jeff Hammerbacher, tidigare från sociala nätverksjätten Facebook och chefen som skapade Hive-projektet, som är ett datalagerlager som fungerar tillsammans med Hadoop och som Facebook använder för att analysera sina många petabyte av information som lagras i dess användardata. lager.
  7. Businessweek, 2010 , Finansiering: 11 miljoner dollar från Accel Partners, Greylock Partners och ängelinvesterare som inkluderar Gideon Yu och Caterina Fake.
  8. Prickett-Morgan, 2009 , ...Doug Cutting och Mike Cafarella som rådgivare samt Diane Green (grundare och tidigare VD på virtualiseringsspecialisten VMware) och Marten Mikos.
  9. Handy, Alex. Hadoop-skaparen går till Cloudera  (engelska)  (nedlänk) . SD Times (9 oktober 2009). Hämtad 25 december 2011. Arkiverad från originalet 11 mars 2012.
  10. Businessweek, 2010 , Cloudera medgrundare Christophe Bisciglia var en av Bloomberg BusinessWeeks bästa unga tekniska entreprenörer 2009.
  11. Businessweek, 2010 , Tuffaste beslutet: Ändra Clouderas affärsmodell för att göra den till en mjukvaruleverantör.
  12. Worthen, Ben . Tidvattenskiften på start-ups på webben  (engelska) , N. Y. : The Wall Street Journal  (22 november 2011). Arkiverad från originalet den 25 december 2011. Åtkom den 28 december 2011.  "Fler stora finansieringsaffärer har träffats sedan dess, inklusive 85 miljoner dollar för personal-programvarutillverkaren Workday Inc., 81 miljoner dollar för online-fildelningssajten Box.net Inc., 50 miljoner dollar för marknadsföring företaget Marketo Inc. och 40 miljoner dollar för datahanteringsföretaget Cloudera Inc.
  13. 1 2 Darrow, Barb Cloudera fångar $65 miljoner mer för att öka internationell företagstillväxt  (  otillgänglig länk) . Gigaom (6 december 2012). — "Finansieringsrundan leddes av Accel Partners med hjälp av Greylock Partners, Ignition Partners, In-Q-Tel och Meritech Capital Partners." Datum för åtkomst: 10 december 2012. Arkiverad från originalet den 17 december 2012.
  14. Rao, 2011 , Cloudera tillkännagav just $40 miljoner i ny finansiering ledd av Ignition Partners, Greylock, Accel, Meritech Capital Partners och In-Q-Tel.
  15. Brust, Andrew Clouderas Impala tar Hadoop till SQL och BI . Big Data älskling Clouderas Impala-produkt främjar SQL till peer-nivå med  MapReduce . ZDNet (25 oktober 2012) .  "Istället för att locka "old school" databas- och BI-proffs (dvs majoriteten av företagsutvecklare och DBA:er) att flytta till Hadoop, tillkännagav den betaversionen av en ny produkt, Impala, som tar Hadoop till dem. Hämtad 1 januari 2014. Arkiverad från originalet 2 januari 2014.
  16. 1 2 Prickett Morgan Cloudera anlitar ny VD för oundviklig börsintroduktion eller förvärv . Tidigare vd blir ordförande och  chefsstrateg . Registret (20 juni 2013) . Hämtad 1 januari 2014. Arkiverad från originalet 2 januari 2014.
  17. Clark, Jack Cloudera förvärv: Det är en Myrrix (cle) . Elefant fnyser elefantbebis för maskininlärning  (engelska)  (nedlänk) . Registret (16 juli 2013) . Hämtad 17 juli 2013. Arkiverad från originalet 31 augusti 2013.
  18. 1 2 Harris, Dereck Intel kastar bort sin Hadoop-distro och sätter miljoner bakom  Cloudera . Gigaom (27 mars 2014). Hämtad 1 april 2014. Arkiverad från originalet 30 mars 2014.
  19. Clark, Jack Rör inte min bål! Intel är 740 miljoner dollar lättare efter Cloudera cash shot . En enorm finansieringsaffär håller Oracle, IBM borta från uppstickarens gula  elefant . Registret (31 mars 2014) . Hämtad 1 april 2014. Arkiverad från originalet 4 april 2014.
  20. Liam Tung. Cloudera köper stordatakrypteringsutrustning Gazzang . Cloudera köper Gazzang för att erbjuda företagskunder kryptering för data i vila i Hadoop-kluster . ZDNet (15 juni 2014) . Hämtad 23 september 2018. Arkiverad från originalet 25 september 2019.
  21. Anita Balakrishnan. Cloudera-aktien stänger mer än 20 % högre på dag 1 . CNBC (28 april 2017). Hämtad 23 september 2018. Arkiverad från originalet 23 september 2018.
  22. Rebecca Hill. Cloudera väcker AI biz, uppmärksammar IBM-kunder... och fortsätter att rapportera rörelseförluster . Någon har lagt märke till Big Blues avtal med Hortonworks . Registret (8 september 2017) . Hämtad 23 september 2018. Arkiverad från originalet 23 september 2018.
  23. Kevin Kelleher. Cloudera, Hortonworks-aktier stiger när Big-Data-konkurrenterna tillkännager en fusion på $5,2 miljarder . Fortune (3 oktober 2018). Hämtad 4 oktober 2018. Arkiverad från originalet 4 oktober 2018.
  24. Rebecca Hill. Cloudera, Hortonworks smälter samman till en amorf datahanterande klump efter aktieägarröstning . Nytt utseende företag vänder uppmärksamheten till PR-offensiv . Registret (7 januari 2019) . Hämtad 7 januari 2019. Arkiverad från originalet 8 januari 2019.
  25. Andrew Brust. Cloudera och Hortonworks fusion avslutas; quo vadis Big Data? . De två största Hadoop-distributionsleverantörerna är nu en. Vad betyder detta för Big Data-världen, för kunder och för Apache Hadoop? . ZDNet (4 januari 2019) . Hämtad 7 januari 2019. Arkiverad från originalet 31 januari 2019.
  26. Max A. Cherney. Cloudera köper tillbaka $314 miljoner Intel-insatser. Här är vad det betyder för aktien . Barron's (23 december 2020). Hämtad 25 december 2020. Arkiverad från originalet 25 december 2020.
  27. Pricket Morgan, Timothy Oracle monterar Clouderas elefant för big data-ritt  (eng.)  (länk ej tillgänglig) . Registret (10 januari 2012). Datum för åtkomst: 13 januari 2012. Arkiverad från originalet den 6 september 2012.
  28. Tony Baer. Cloudera Enterprise 6 kommer ut på gatorna . Hadoop 3.0 tar en huvudroll i nästa utgåva av Clouderas plattform . ZDNet (22 maj 2018) . Hämtad 23 september 2018. Arkiverad från originalet 27 november 2020.
  29. Pricket Morgan, Timothy. Cloudera blir proaktiv med Hadoop-hantering  (eng.)  (nedlänk) . Registret (8 september 2011). Hämtad 15 april 2013. Arkiverad från originalet 18 april 2013.

Länkar