Catboost

Den aktuella versionen av sidan har ännu inte granskats av erfarna bidragsgivare och kan skilja sig väsentligt från versionen som granskades den 6 juni 2022; kontroller kräver 2 redigeringar .
catboost
Sorts Bibliotek för maskininlärning
Utvecklaren Yandex
Skrivet i C++ , Python , JavaScript
Första upplagan 18 juli 2017
Hårdvaruplattform Linux , macOS , Windows
senaste versionen 1.0.0 (1 oktober 2021)
stat Aktiva
Licens Apache 2.0
Hemsida catboost.ai

CatBoost är ett mjukvarubibliotek med  öppen källkod utvecklat av Yandex och implementerar en unik patenterad algoritm för att bygga maskininlärningsmodeller med hjälp av ett av de ursprungliga gradientförstärkningssystemen . Huvud -API :et för att arbeta med biblioteket är implementerat för Python-språket , det finns även en implementering för programmeringsspråket R.

Den 18 juli 2017 släppte Yandex biblioteket med CatBoost-algoritmen till allmänheten under Apache 2.0 öppna licensen [1] [2] [3] , som är en fortsättning och utveckling av det stängda Yandex-projektet - Matrixnet .

Historik

Matrixnet

Det slutna maskininlärningssystemet Matrixnet har utvecklats av Yandex sedan 2009 för att använda gradientförstärkning i företagets interna projekt, främst för att bygga en formel för att rangordna sökresultat [4] .

catboost

Den 18 juli 2017 gjordes CatBoost tillgänglig för fri tillgångGitHub av Yandex under en gratis Apache 2.0-licens . CatBoost är ett maskininlärningssystem som använder ett av de ursprungliga gradientförstärkningsscheman. CatBoost är tillgängligt för 64-bitars Linux- , macOS- och Windows - operativsystem . macOS använder det ursprungliga Core ML- ramverket för att påskynda arbetet  - skapad av Apple för metoder för maskininlärning .

Genom att jämföra CatBoost med liknande maskininlärningssystem från Google ( TensorFlow ) och Microsoft ( LightGBM ), noterade Anna Veronika Dorogush, Head of Machine Learning Development på Yandex, att Google TensorFlow löser en annan klass av problem genom att effektivt analysera homogena data, såsom bilder. Och "CatBoost arbetar med data av en annan karaktär och kan användas i kombination med TensorFlow och andra maskininlärningsalgoritmer, beroende på specifika uppgifter . " Hos Microsoft LightGBM vinner den ryska utvecklingen i kvalitet, vilket framgår av testtabellen med jämförelser allmänt accepterade inom maskininlärning, men än så länge tappar den i hastighet - vilket Yandex lovar att fixa [5] .

Applikation

Först och främst används CatBoost-tekniken för att förbättra resultaten av Yandex -sökmotorn , ranka ett personligt rekommendationsflöde - till exempel i Yandex.Zen , för beräkning av väderprognoser och i andra Yandex Internettjänster , där det visade sig vara bättre än den tidigare tekniken - Matrixnet . Yandex Data Factory-teamet använder också denna teknik i sina lösningar för industrin , i synnerhet används den för att optimera förbrukningen av råvaror och förutsäga defekter i produktionen.

CatBoost implementerades av European Centre for Nuclear Research ( CERN ) under forskning vid Large Hadron Collider (LHC) för att kombinera information från olika delar av LHCb- detektorn till den mest exakta, aggregerade kunskapen om en partikel. Genom att använda CatBoost för att kombinera data, lyckades forskare förbättra de kvalitativa egenskaperna hos den slutliga lösningen, där resultaten av CatBoost visade sig vara bättre än resultaten som erhölls med andra metoder [6] [7] .

Anteckningar

  1. Yandex har släppt ett nytt maskininlärningsbibliotek för allmänheten . Yandex . (18 juli 2017). Hämtad 8 juni 2018. Arkiverad från originalet 12 juni 2018.
  2. CatBoost är en ny maskininlärningsmetod från Yandex . Yandex . (18 juli 2017). Hämtad 8 juni 2018. Arkiverad från originalet 12 juni 2018.
  3. Yandex öppnar CatBoost maskininlärningsteknik . Habr . (18 juli 2017). Hämtad 8 juni 2018. Arkiverad från originalet 12 juni 2018.
  4. Teknologi: Matrixnet . Yandex . . Hämtad 8 juni 2018. Arkiverad från originalet 8 juni 2018.
  5. Varför öppnade Yandex åtkomst till sitt maskininlärningssystem . Forbes . (19 juli 2017). Hämtad 8 juni 2018. Arkiverad från originalet 7 juni 2018.
  6. "Yandex" har publicerat ett alternativ till neurala nätverk i det offentliga området . Nyheter . (18 juli 2017). Hämtad 8 juni 2018. Arkiverad från originalet 12 juni 2018.
  7. "Yandex" introducerade en ny maskininlärningsmetod CatBoost . 3D Nyheter . (18 juli 2017). Hämtad 8 juni 2018. Arkiverad från originalet 12 juni 2018.

Länk