Prognosproblem - inom prognostisering finns det olika speciella typer av klassiska prognosproblem. Att formulera sådana problem på ett enhetligt sätt gör det möjligt att jämföra de olika metoderna som erbjuds av olika discipliner.
Patienter fungerar som objekt. Tecken kännetecknar resultaten av undersökningar, symtomen på sjukdomen och de behandlingsmetoder som används. Exempel på binära tecken: kön, huvudvärk, svaghet. Ordinaltecknet är tillståndets svårighetsgrad (tillfredsställande, måttlig, svår, extremt svår). Kvantitativa tecken - ålder, puls, blodtryck, hemoglobinhalt i blodet, dos av läkemedlet. Den symtomatiska beskrivningen av patienten är i själva verket en formaliserad fallhistoria . Efter att ha samlat ett tillräckligt antal prejudikat i elektronisk form kan du lösa olika problem:
Värdet med sådana system är att de omedelbart kan analysera och generalisera ett stort antal prejudikat - en möjlighet som inte är tillgänglig för en medicinsk specialist.
Tecken är geologiska prospekteringsdata. Närvaron eller frånvaron av vissa raser på områdets territorium kodas av binära funktioner. De fysikalisk-kemiska egenskaperna hos dessa bergarter kan beskrivas både kvantitativt och kvalitativt. Träningsprovet är sammansatt av prejudikat av två klasser: områden med kända fyndigheter och liknande områden där fossilet av intresse inte hittades. När man söker efter sällsynta mineraler kan antalet föremål vara mycket mindre än antalet tecken. I denna situation fungerar inte klassiska statistiska metoder bra. Problemet löses genom att söka efter mönster i den befintliga datamatrisen. I processen att lösa identifieras korta uppsättningar funktioner som har det största informationsinnehållet - förmågan att på bästa sätt separera klasser. I analogi med ett medicinskt problem kan vi säga att "syndrom" av avlagringar eftersträvas. Detta är en viktig biprodukt av studien, av stort intresse för geofysiker och geologer.
Detta problem löses av banker när de ger ut lån. Behovet av att automatisera utlåningsprocessen uppstod först under kreditkortsboomen på 1960- och 1970-talen. i USA och andra utvecklade länder. Objekten i detta fall är individer eller juridiska personer som ansöker om ett lån. För enskilda personer består den vägledande beskrivningen av ett frågeformulär som låntagaren själv fyllt i, och eventuellt ytterligare information som banken samlar in om honom från egna källor. Exempel på binära tecken: kön, närvaro av en telefon. Namntecken - bostadsort, yrke, arbetsgivare. Ordinella tecken - utbildning, position. Kvantitativa egenskaper - lånebeloppet, ålder, arbetslivserfarenhet, familjens inkomst, mängden skulder i andra banker. Utbildningsprovet består av låntagare med känd kredithistorik. I det enklaste fallet reduceras beslutsfattandet till att klassificera låntagare i två klasser: "bra" och "dåliga". Lån ges endast till förstklassiga låntagare. I ett mer komplext fall uppskattas det totala antalet poäng (poäng (engelska) ) för låntagaren, poängsatt på en uppsättning informativa funktioner. Ju högre poäng, desto mer pålitlig anses låntagaren. Därav namnet- credit scoring . På utbildningsstadiet syntetiseras och väljs informativa funktioner och det bestäms hur många poäng som ska tilldelas för varje funktion så att risken för att beslut fattas är minimal. Nästa uppgift är att besluta om vilka villkor för att utfärda ett lån: att bestämma räntan, återbetalningstiden och andra parametrar i låneavtalet. Detta problem kan också lösas genom att använda prejudikatinlärningsmetoder.
Lösas av moderna stormarknader och butikskedjor. För effektiv hantering av handelsnätverket är det nödvändigt att förutsäga försäljningsvolymer för varje produkt för ett givet antal dagar i förväg. Utifrån dessa prognoser genomförs inköpsplanering, sortimentshantering, prispolicy, planering av kampanjer (annonskampanjer). Det specifika med uppgiften är att antalet varor kan vara i tiotals eller till och med hundratusentals. Att prognostisera och fatta beslut för varje produkt "manuellt" är helt enkelt otänkbart. De initiala uppgifterna för prognoser är tidsserier av priser och försäljningsvolymer för varor och för enskilda butiker. Modern teknik gör att du kan ta dessa uppgifter direkt från kassaregister. För att öka noggrannheten i prognoserna är det också nödvändigt att ta hänsyn till olika externa faktorer som påverkar konsumenternas efterfrågan: inflation , väderförhållanden, reklamkampanjer, sociodemografiska förhållanden och konkurrenters aktivitet. Beroende på målen för analysen fungerar antingen varor eller butiker, eller par av "butik, varor" som objekt. En annan egenskap hos problemet är förlustfunktionens asymmetri. Om prognosen görs i syfte att planera inköp, så är förlusterna från en underskattad prognos betydligt högre än förlusterna från en överskattad.
I denna uppgift omvandlas förmågan att förutsäga väl mest direkt till vinst. Om en investerare förväntar sig att priset på en aktie ska stiga, köper han aktien i hopp om att sälja den senare till ett högre pris. Och omvänt, förutsäga ett prisfall, säljer investeraren aktier för att senare köpa tillbaka dem till ett lägre pris. Investerarspekulantens uppgift är att korrekt förutsäga riktningen för den framtida prisförändringen - tillväxt eller fall. Automatiska handelsstrategier är mycket populära – algoritmer som fattar handelsbeslut utan mänsklig inblandning. Utvecklingen av en sådan algoritm är också en uppgift för övervakat lärande. Situationer, faktiskt, ögonblick av tid fungerar som objekt. Beskrivningen av ett objekt är hela historien om förändringar i priser och handelsvolymer, registrerad fram till nu. I det enklaste fallet måste objekt klassificeras i tre klasser som motsvarar möjliga beslut: köp, sälj eller vänta. Utbildningsprovet för att sätta upp handelsstrategier är historiska data om rörelser av priser och volymer under en viss tidsperiod. Kvalitetskriteriet i detta problem skiljer sig avsevärt från det funktionella standardmedelfelet, eftersom investeraren inte är intresserad av att prognostisera noggrannhet, utan av att maximera den slutliga vinsten. Modern börsteknisk analys inkluderar hundratals parametriska handelsstrategier, vars parametrar vanligtvis justeras enligt kriteriet för maximal vinst på det valda historikintervallet.