Automatisk maskininlärning
Automatiserad maskininlärning ( AutoML ) är processen att automatisera hela processen för att tillämpa maskininlärning på verkliga problem. I en typisk maskininlärningsapplikation måste användaren tillämpa lämplig dataförbearbetning , funktionsteknik, funktionsextraktion och funktionsvalsmetoder som datamängden lämplig för maskininlärning. Efter dessa steg måste arbetaren utföra algoritmval och hyperparameteroptimering för att maximera den förutsedda prestandan för den slutliga modellen. Eftersom många av dessa steg inte kan utföras av människor utan att vara experter, har AutoML-metoden föreslagits som en AI-baserad lösning på det ständigt ökande behovet av maskininlärning [1] [2] . Att automatisera end-to-end-processen för att tillämpa maskininlärning har fördelen av att få enklare lösningar, snabbare skapande av sådana lösningar och modeller som ofta överträffar manuellt byggda modeller.
Automatisk maskininlärning kan rikta in sig på olika stadier av processen [2] :
- automatisk databeredning och datainsamling och lagring (från rådata och olika format):
- automatisk detektering av kolumntypen, såsom boolesk data, diskreta numeriska data, kontinuerliga numeriska värden eller text;
- automatisk bestämning av betydelsen av kolumnen; till exempel ett mål, en etikett, ett regionaliseringsfält , ett numeriskt attribut, en textkategori eller fri text;
- automatisk uppgiftsupptäckt, såsom binär klassificering , regression , klustring eller rangordning ;
- automatisk funktionskonstruktion :
- funktionsval
- särdragsextraktion
- meta -learning och transfer learning
- upptäckt och bearbetning av asymmetriska data eller saknade värden;
- automatiskt val av modell ;
- optimering av hyperparametrar för inlärnings- och karakteriseringsalgoritmen;
- automatiskt val av kanaler efter tid, minne och svårighetsgränser;
- automatiskt urval av utvärderingsmått och valideringsprocedurer;
- automatisk uppgiftskontroll:
- läckagedetektering;
- identifiera konfigurationsfel;
- automatisk analys av de erhållna resultaten;
- anpassade resultat och visualisering för automatisk maskininlärning
Anteckningar
- ↑ Auto-WEKA: Kombinerad urval och hyperparameteroptimering av klassificeringsalgoritmer . KDD '13 Proceedings of the 19th ACM SIGKDD international conference on Knowledge discovery and data mining. pp. 847-855.
- ↑ 1 2 Hutter F, Caruana R, Bardenet R, Bilenko M, Guyon I, Kegl B och Larochelle H. AutoML 2014 @ ICML . AutoML 2014 Workshop @ ICML . Hämtad: 28 mars 2018. (obestämd)
Litteratur
- Kotthoff L., Thornton C., Hoos HH, Hutter F., Leyton-Brown K. Auto-WEKA 2.0: Automatiskt modellval och hyperparameteroptimering i WEKA // Journal of Machine Learning Research. — 2017.
- Feurer M., Klein A., Eggensperger K., Springenberg J., Blum M., Hutter F. Effektiv och robust automatiserad maskininlärning // Advances in Neural Information Processing Systems 28 (NIPS 2015). — 2015.
- Olson RS, Urbanowicz RJ, Andrews PC, Lavender NA, Kidd L., Moore JH Automatisera biomedicinsk datavetenskap genom trädbaserad pipelineoptimering // Proceedings of EvoStar 2016. - 2016. - doi : 10.1007/978-3-3419-312 -0_9 . - arXiv : 1601.07925 .
- Olson RS, Bartley N., Urbanowicz RJ, Moore JH Evaluation of a Tree-based Pipeline Optimization Tool for Automating Data Science // Proceedings of EvoBIO 2016. - 2016. - doi : 10.1145/2908812.2908918 . - arXiv : 1603.06212 .
- Alex GC de Sá, Walter José GS Pinto, Luiz Otavio VB Oliveira, Gisele L. Pappa. RECEPT : Ett grammatikbaserat ramverk för automatiskt utvecklande klassificeringsrörledningar . - Springer International Publishing, 2017. - (Lecture Notes in Computer Science). — ISBN 9783319556956 . - doi : 10.1007/978-3-319-55696-3_16 .