Cloudera Inc. | |
---|---|
Sorts | publikt bolag |
Börsnotering _ | NYSE : CLDR |
Bas | 2009 |
Grundare |
Christophe Biscilla, Amr Awadalla, Jeffrey Hammerbacher, Michael Olson |
Plats | USA :Palo Alto |
Nyckelfigurer |
Reilly, Tom (VD), Doug Cutting (chefsarkitekt) |
Industri | mjukvaruutveckling ( ISIC :) 6201 _ |
Produkter | Kommersiell version av Hadoop , Cloudera Impala |
omsättning | ▲ 301 miljoner USD (2018) |
Rörelseresultat | ▼ −389 miljoner USD (förlust, 2018) |
Nettoförtjänst | ▼ −386 miljoner USD (förlust, 2018) |
Kapitalisering | 2,66 miljarder USD (7 september 2018) [1] |
Hemsida | cloudera.com |
Mediafiler på Wikimedia Commons |
Cloudera är ett amerikanskt företag som utvecklar Apache Hadoop- distributioner och ett antal Hadoop ekosystemprogramvaruprodukter .
Företagets affärsmodell har jämförts med Red Hats verksamhet - Cloudera skapar distributioner av mjukvaruprodukter för organisationer baserade på fri mjukvara och gör vinst genom att tillhandahålla teknisk support för de levererade lösningarna [2] [3] . Med uppsvinget inom " big data "-teknologier har Cloudera upprepade gånger erkänts som ett av de mest lovande företagen som kan lösa problem i sin klass [4] [5] .
Under 2018 absorberade det huvudkonkurrenten på Hadoop-distributionsmarknaden, det amerikanska företaget Hortonworks .
Företaget grundades i oktober 2008 i Burlingame ( Kalifornien ) med ett startkapital på 5 miljoner dollar, huvudmålet för verksamheten var kommersialiseringen av Hadoop- projektet . Grundarna av företaget är Christophe Bischiglia , som tidigare arbetat på Google , Amr Awadallah ( Amr Awadallah , Vice President för Yahoo Corporation , ansvarig för analyssystem och datalagring), Jeffrey Hammerbacher ( Jeff Hammerbacher , Hive- projektledare på Facebook ) och Michael Olson , vice vd för Oracle Corporation , tidigare VD för Sleepecat , som utvecklade och utvecklade Berkeley DB och absorberades 2006 av Oracle) [6] . Hammerbacher ordnade startfinansiering för projektet från Accel Partners , där Olson tog över företaget. Totalt samlades 11 miljoner dollar in i det inledande skedet, och förutom Accel finns Greylock Partners och affärsänglarna Gideon Yu och Caterina Fake listade bland investerarna [ 7 ] .
Bland de anställda som anställdes under de första månaderna fanns Hadoop-skaparna Doug Cutting och Mike Cafarella , tidigare VD:ar för VMware ( Diane Green ) och MySQL AB ( Marten Mikos ) [8] . Tack vare Cuttings flytt till Cloudera har företaget beskrivits som "den nya flaggbäraren av Hadoop" [9] .
2009 rankades Biscilla på femte plats på Businessweeks topp 22 lista över unga tekniska entreprenörer [10] och Hammerbacher rankades sjua (av 15) 2010 . I Biscilla-nomineringen beskrevs Cloudera som ett tjänsteföretag som tillhandahåller teknisk rådgivning om Hadoop, medan Hammerbachers bidrag 2010 noterades som en förändring av företagets verksamhet, vilket gjorde det till en leverantör av replikerbar programvara för organisationer [11] .
I november 2011 fick företaget ytterligare finansiering till ett belopp av 40 miljoner dollar [12] , i december 2012 - ytterligare 65 miljoner dollar [13] , bland investerarna i de kommande omgångarna finns Ignition Partners , Greylock , Accel , Meritech Capital Partners och In -Q-Tel [ 14] [13] .
I oktober 2012 introducerade företaget Impala -produkten , som ger SQL -åtkomst till data i ett Hadoop-drivet kluster, uppkomsten av en sådan produkt välkomnades som en överraskning, eftersom företagens rådande retorik fokuserade på "big data". "-teknologier var övergivandet av traditionella teknologier baserade på SQL ( eng. old SQL , i samklang med " old school " - old school ) [15] .
I juni 2013 blev Tom Reilly inbjuden till VD - posten , efter att tidigare ha lett två teknikföretag till övertagande av stora aktörer ( MDM-systemtillverkaren Trigo köptes av IBM 2004, och ArcSight togs till börsintroduktion och absorberades snart av Hewlett-Packard 2010) bedöms evenemanget som förberedelse för antingen ett börsnoterat erbjudande eller en försäljning av verksamheten [16] . Olson flyttade till posten som strategisk direktör och styrelseordförande. I juli 2013 tog företaget över det brittiska företaget Myrryx , grundat av Sean Owen , en av huvudförfattarna till Hadoop-ekosystemets skalbara ramverk för maskininlärning Apache Mahout , Owen tillkännagavs som "Director of Data Science " ( Engelsk direktör för datavetenskap ) [17] .
I mitten av 2013 fick företaget totalt 141 miljoner dollar i fem investeringsrundor [16] , och i nästa omgång i mars 2014 samlade företaget in ytterligare 160 miljoner dollar [18] . I mars 2014, efter den sjätte investeringsrundan, förvärvade Intel en andel på 18 % i företaget för 740 miljoner dollar och värderade därmed Clouderas verksamhet till cirka 4 miljarder dollar [19] ; samtidigt övergav Intel utvecklingen av sin egen Hadoop-distribution som skapades ett år tidigare till förmån för att marknadsföra lösningar från Cloudera [18] . I juni 2014 förvärvade företaget datakrypteringsteknikutvecklaren Gazzang [20] .
I april 2017 höll företaget ett börsnoterat erbjudande på New York Stock Exchange , som ett resultat av vilket det tog in 215 miljoner dollar [21] . Hösten 2017 togs det New York-baserade maskininlärningsföretaget Fast Forward Labs över, affären noterades som ett svar på den snäva integrationen av Hortonworks med IBM, som betonar utvecklingen av artificiell intelligens inom Watson- programmet , och övergav sin Hadoop-distribution till förmån för Hortonworks [22] .
I oktober 2018 tillkännagavs en fusion med Hortonworks, medan strukturen behöll Cloudera-namnet, notering på börsen och VD, och Hortonworks aktieägare fick 40 % av aktierna i det sammanslagna bolaget [23] . Transaktionen slutfördes den 3 januari 2019, trots den totala värderingen av de två företagen vid tidpunkten för tillkännagivandet till 5,2 miljarder dollar, efter dess slutförande uppgick kapitaliseringen av den kombinerade verksamheten till cirka 3 miljarder dollar [24] . Övertagandet fullbordade faktiskt stadiet av konsolidering på marknaden för kommersiella distributioner av Hadoop (av alla anmärkningsvärda andra marknadsaktörer återstod endast MapR med en årlig omsättning på cirka 175 miljoner USD 2018), vilket flyttade fokus för konkurrensen till bredare segment - Big data-verktyg och analytiska plattformar [25] .
I slutet av 2020 köpte företaget tillbaka aktier från Intel för 314 miljoner dollar (426 miljoner dollar mindre än 2014 års investering) [26] .
CDH ( Clouderas distribution inklusive Apache Hadoop ) är en Apache Hadoop-distribution som inkluderar ett antal relaterade program och bibliotek och Clouderas egna utvecklingsverktyg, fritt distribuerade och kommersiellt stödda för vissa Linux-distributioner ( Red Hat Enterprise Linux , CentOS , Ubuntu , SuSE SLES , Debian ). Bland Apache-programvaruprojekten relaterade till Hadoop inkluderar distributionen: Flume , HBase , Hive , Mahout , Oozie , Pig , Sqoop , Whirr , Zookeeper . Dessutom inkluderar distributionen sitt eget klusterhanteringsundersystem Cloudera Manager , som inkluderar skript för att distribuera Hadoop-infrastrukturen både i lokala och molnmiljöer ( Rackspace , Amazon EC2 , Softlayer ), samt verktyg och konfigurationer för att stödja byggautomation med Apache Maven .
I början av 2012 skickades två versioner av CDH, CDH2 (baserad på Hadoop 0.20.1) och CDH3 (baserad på Hadoop 0.20.2). CDH3-distributionen ingår i leveransen av Oracle Big Data-apparaten [27] hård- och mjukvarukomplex , dessutom tillhandahålls den första raden av kundsupport för Hadoop av Oracle Corporation , och Cloudera tillhandahåller teknisk support för mer komplexa problem. I mitten av 2012 släpptes en version av CDH4 baserad på Hadoop 2.0 (inklusive YARN- modulen ), tre av företagets egna produkter ingår också i CDH4 - Hue (webbläsargränssnitt för att hantera ett Hadoop-kluster), Impala och Sök (fulltext och facetterad sökning i HDFS- och HBase- miljöer ). 2014 släpptes CDH5-versionen; CDH6-versionen, som släpptes våren 2018, är baserad på Hadoop 3.0 (vars nyckelinnovation var stöd för felkorrigerande kodning för HDFS, vilket avsevärt kan minska den fysiska storleken på kluster) [28] .
Cloudera Impala är en massivt parallell SQL -frågemotorför data lagrad i HDFS och HBase , distribuerad under Apache 2.0 -licensen. Till skillnad från Hive , som översätter frågor på ett SQL-liknande språk (HiveQL) till MapReduce-jobb som körs i batch-läge, kör Impala frågor i en distribuerad miljö interaktivt och distribuerar frågan mellan bearbetningsnoder baserat på sin egen mekanism, utan att tillgripa MapReduce.
Cloudera Manager är en specialiserad komponent som låter dig automatisera skapandet och modifieringen av Hadoop-miljöer, spåra och analysera effektiviteten av bearbetningsuppgifter, ställa in varningar om förekomsten av vissa händelser relaterade till driften av den distribuerade bearbetningsinfrastrukturen. Den årliga kostnaden för teknisk support är cirka 4 000 USD per klusternod [29] . Det finns en gratisutgåva för Cloudera Manager ( engelsk gratisutgåva ), som endast fungerar på kluster som består av mindre än 50 noder och som saknar ett antal funktioner tillgängliga för kommersiella prenumeranter (såsom prestandaövervakning, konfigurationsversion, Kerberos-stöd ).
Efter Garnters förutsägelse i 2017 års datahanteringsteknologihypecykel att själva konceptet med en "Hadoop-distribution" snart kommer att bli föråldrat, har företaget flyttat sitt produktutbud till tematiska kit, som består av praktiskt taget samma komponenter som är monterade i CDH, men syftar till vissa specifika uppgifter. Så under 2018 dök produkter upp under namnen Data Warehouse (montering för datalager , med fokus på Impala), Operational DB (för operationella databaser, kring HBase , Kudu och Spark ), Data Engineering (för ETL och interaktiva tillgång till data), Data Science (för " data science "-uppgifter ), Enterprise Data Hub (för dataplattformar på företagsnivå - i själva verket en komplett sammansättning av Hadoop-distributionen plus en datakatalog baserad på dess egen SDX-komponent).
Sedan 2018 har prispolicyn utformats kring tematiska produkter; Beroende på konfigurationen betalar prenumeranter årligen från 4 000 USD för att stödja varje produktnod för Data Engineering och Data Science till 10 000 USD för en Enterprise Data Hub-produktnod.