catboost | |
---|---|
Sorts | Bibliotek för maskininlärning |
Utvecklaren | Yandex |
Skrivet i | C++ , Python , JavaScript |
Första upplagan | 18 juli 2017 |
Hårdvaruplattform | Linux , macOS , Windows |
senaste versionen | 1.0.0 (1 oktober 2021) |
stat | Aktiva |
Licens | Apache 2.0 |
Hemsida | catboost.ai |
CatBoost är ett mjukvarubibliotek med öppen källkod utvecklat av Yandex och implementerar en unik patenterad algoritm för att bygga maskininlärningsmodeller med hjälp av ett av de ursprungliga gradientförstärkningssystemen . Huvud -API :et för att arbeta med biblioteket är implementerat för Python-språket , det finns även en implementering för programmeringsspråket R.
Den 18 juli 2017 släppte Yandex biblioteket med CatBoost-algoritmen till allmänheten under Apache 2.0 öppna licensen [1] [2] [3] , som är en fortsättning och utveckling av det stängda Yandex-projektet - Matrixnet .
Det slutna maskininlärningssystemet Matrixnet har utvecklats av Yandex sedan 2009 för att använda gradientförstärkning i företagets interna projekt, främst för att bygga en formel för att rangordna sökresultat [4] .
Den 18 juli 2017 gjordes CatBoost tillgänglig för fri tillgång på GitHub av Yandex under en gratis Apache 2.0-licens . CatBoost är ett maskininlärningssystem som använder ett av de ursprungliga gradientförstärkningsscheman. CatBoost är tillgängligt för 64-bitars Linux- , macOS- och Windows - operativsystem . macOS använder det ursprungliga Core ML- ramverket för att påskynda arbetet - skapad av Apple för metoder för maskininlärning .
Genom att jämföra CatBoost med liknande maskininlärningssystem från Google ( TensorFlow ) och Microsoft ( LightGBM ), noterade Anna Veronika Dorogush, Head of Machine Learning Development på Yandex, att Google TensorFlow löser en annan klass av problem genom att effektivt analysera homogena data, såsom bilder. Och "CatBoost arbetar med data av en annan karaktär och kan användas i kombination med TensorFlow och andra maskininlärningsalgoritmer, beroende på specifika uppgifter . " Hos Microsoft LightGBM vinner den ryska utvecklingen i kvalitet, vilket framgår av testtabellen med jämförelser allmänt accepterade inom maskininlärning, men än så länge tappar den i hastighet - vilket Yandex lovar att fixa [5] .
Först och främst används CatBoost-tekniken för att förbättra resultaten av Yandex -sökmotorn , ranka ett personligt rekommendationsflöde - till exempel i Yandex.Zen , för beräkning av väderprognoser och i andra Yandex Internettjänster , där det visade sig vara bättre än den tidigare tekniken - Matrixnet . Yandex Data Factory-teamet använder också denna teknik i sina lösningar för industrin , i synnerhet används den för att optimera förbrukningen av råvaror och förutsäga defekter i produktionen.
CatBoost implementerades av European Centre for Nuclear Research ( CERN ) under forskning vid Large Hadron Collider (LHC) för att kombinera information från olika delar av LHCb- detektorn till den mest exakta, aggregerade kunskapen om en partikel. Genom att använda CatBoost för att kombinera data, lyckades forskare förbättra de kvalitativa egenskaperna hos den slutliga lösningen, där resultaten av CatBoost visade sig vara bättre än resultaten som erhölls med andra metoder [6] [7] .
Yandex | ||||||||
---|---|---|---|---|---|---|---|---|
människor |
| |||||||
Söktjänster |
| |||||||
Foodtech |
| |||||||
Personliga tjänster | ||||||||
Aggregatorer | ||||||||
Webbansvariga och företag |
| |||||||
Fintech |
| |||||||
Program |
| |||||||
Teknologi |
| |||||||
Enheter |
| |||||||
Smart hus |
| |||||||
Motortransport |
| |||||||
Budrobotar | ||||||||
Utbildning | ||||||||
Slutna projekt | ||||||||
Yandex 360- tjänster | ||||||||
Övrig | ||||||||
|
Program för djupinlärning | |
---|---|
gratis mjukvara |
|
Icke-fri programvara |
|
|