Automatisk maskininlärning

Automatiserad maskininlärning ( AutoML ) är processen att automatisera hela processen för att tillämpa maskininlärning på verkliga problem. I en typisk maskininlärningsapplikation måste användaren tillämpa lämplig dataförbearbetning , funktionsteknik, funktionsextraktion och funktionsvalsmetoder som datamängden lämplig för maskininlärning. Efter dessa steg måste arbetaren utföra algoritmval och hyperparameteroptimering för att maximera den förutsedda prestandan för den slutliga modellen. Eftersom många av dessa steg inte kan utföras av människor utan att vara experter, har AutoML-metoden föreslagits som en AI-baserad lösning på det ständigt ökande behovet av maskininlärning [1] [2] . Att automatisera end-to-end-processen för att tillämpa maskininlärning har fördelen av att få enklare lösningar, snabbare skapande av sådana lösningar och modeller som ofta överträffar manuellt byggda modeller.

Automatisk maskininlärning kan rikta in sig på olika stadier av processen [2] :

automatisk databeredning och datainsamling och lagring (från rådata och olika format):
- automatisk detektering av kolumntypen, såsom boolesk data, diskreta numeriska data, kontinuerliga numeriska värden eller text;
- automatisk bestämning av betydelsen av kolumnen; till exempel ett mål, en etikett, ett regionaliseringsfält , ett numeriskt attribut, en textkategori eller fri text;
- automatisk uppgiftsupptäckt, såsom binär klassificering , regression , klustring eller rangordning ;
automatisk funktionskonstruktion :
- funktionsval
- särdragsextraktion
- meta -learning och transfer learning
- upptäckt och bearbetning av asymmetriska data eller saknade värden;
automatiskt val av modell ;
optimering av hyperparametrar för inlärnings- och karakteriseringsalgoritmen;
automatiskt val av kanaler efter tid, minne och svårighetsgränser;
automatiskt urval av utvärderingsmått och valideringsprocedurer;
automatisk uppgiftskontroll:
- läckagedetektering;
- identifiera konfigurationsfel;
automatisk analys av de erhållna resultaten;
anpassade resultat och visualisering för automatisk maskininlärning

Anteckningar

↑ Auto-WEKA: Kombinerad urval och hyperparameteroptimering av klassificeringsalgoritmer . KDD '13 Proceedings of the 19th ACM SIGKDD international conference on Knowledge discovery and data mining. pp. 847-855. Okänd parameter |год=( hjälp ); Okänd parameter |автор=( hjälp ); Okänd parameter |ссылка=( hjälp )
↑ 1 2 Hutter F, Caruana R, Bardenet R, Bilenko M, Guyon I, Kegl B och Larochelle H. AutoML 2014 @ ICML . AutoML 2014 Workshop @ ICML . Hämtad: 28 mars 2018. (obestämd)

Litteratur

Kotthoff L., Thornton C., Hoos HH, Hutter F., Leyton-Brown K. Auto-WEKA 2.0: Automatiskt modellval och hyperparameteroptimering i WEKA // Journal of Machine Learning Research. — 2017.
Feurer M., Klein A., Eggensperger K., Springenberg J., Blum M., Hutter F. Effektiv och robust automatiserad maskininlärning // Advances in Neural Information Processing Systems 28 (NIPS 2015). — 2015.
Olson RS, Urbanowicz RJ, Andrews PC, Lavender NA, Kidd L., Moore JH Automatisera biomedicinsk datavetenskap genom trädbaserad pipelineoptimering // Proceedings of EvoStar 2016. - 2016. - doi : 10.1007/978-3-3419-312 -0_9 . - arXiv : 1601.07925 .
Olson RS, Bartley N., Urbanowicz RJ, Moore JH Evaluation of a Tree-based Pipeline Optimization Tool for Automating Data Science // Proceedings of EvoBIO 2016. - 2016. - doi : 10.1145/2908812.2908918 . - arXiv : 1603.06212 .
Alex GC de Sá, Walter José GS Pinto, Luiz Otavio VB Oliveira, Gisele L. Pappa. RECEPT : Ett grammatikbaserat ramverk för automatiskt utvecklande klassificeringsrörledningar . - Springer International Publishing, 2017. - (Lecture Notes in Computer Science). — ISBN 9783319556956 . - doi : 10.1007/978-3-319-55696-3_16 .

Maskininlärning och datautvinning
Uppgifter	Klassificeringsproblem Lärande utan lärare Lärarassisterat lärande Regressionsanalys AutoML Föreningens regler Särdragsextraktion Egenskapsträning Ranking utbildning Grammatisk härledning Online lärande
Att lära sig med en lärare	k-närmaste granne metod Naiv Bayes klassificerare beslutsträd Stöd vektor maskin Linjär regression Logistisk tillbakagång perceptron Ensembler av modeller Säckväv förstärkning slumpmässig skog Relevant vektormetod
klusteranalys	k-betyder metod Fuzzy klustringsmetod Hierarkisk klustring EM algoritm BJÖRK BOTA DBSCAN OPTIK Genomsnittlig förskjutning
Dimensionalitetsreduktion	Faktoranalys Huvudkomponentmetoden CCA ICA LDA Icke-negativ matrisexpansion t-SNE
Strukturell prognos	Graph probabilistisk modell Bayesiskt nätverk Dold Markov-modell CRF
Anomali upptäckt	k-närmaste granne metod Lokal utsläppsnivå
Grafisk probabilistiska modeller	Bayesiskt nätverk Markov nätverk Dold Markov-modell
Neurala nätverk	Begränsad Boltzmann-maskin självorganiserande karta Aktiveringsfunktion Sigmoid softmax Radiell basfunktion Ryggförökningsmetod Djup lärning Flerskiktsperceptron Återkommande neurala nätverk långtidsminne Kontrollerat återkommande block Konvolutionellt neuralt nätverk U-nät Autokodare
Förstärkningsinlärning	Markov process Bellmans ekvation Girig algoritm Q-lärande SARSA Temporell skillnad (TD)
Teori	Vapnik-Chervonenkis teori Bias-Dispersion Dilemma Beräkningslärandeteori Empirisk riskminimering Occam lär sig PAC-inlärning Statistisk inlärningsteori
Tidskrifter och konferenser	NeurIPS ICML ML JMLR ArXiv:cs.LG