Hög tillgänglighet är en egenskap hos ett tekniskt system utformat för att undvika missat underhåll genom att minska eller hantera fel och minimera planerade stillestånd. Hög tillgänglighet förväntas från livsuppehållande system , hälso- och sjukvårdssystem och system på vilka samhällets välbefinnande som helhet och enskilda organisationers ekonomiska välbefinnande är beroende av [1] .
Hög tillgänglighet för datoranvändning ( eng. Highly available computing ) tillhandahålls av datorsystem som är designade för att minimera tiden för både planerad och oplanerad driftstopp [1] .
Hög tillgänglighet kan definieras som egenskapen hos ett system som ska skyddas och enkelt återställas från små avbrott på kort tid och med automatiserade medel. I denna definition beaktas tre faktorer: kategorisering av möjliga problem (misslyckanden), kategorisering av systemkrav i förhållande till varaktigheten av avbrott i arbetet, tekniska lösningar för automatiskt skydd och återställning efter fel [2] .
Under insamlingen av användarkrav för systemet visar det sig vanligtvis vilken nivå de behöver [3] [4] :
Kostnaden för implementering och drift av systemet beror på den önskade tillgänglighetsnivån. Dessutom, eftersom tillgänglighet definieras ur ett användarperspektiv, ofta subjektivt, är det värt att definiera exakt vad som menas med systemhög tillgänglighet i systemkraven [5] .
För att beräkna den uppnådda tillgänglighetsnivån behöver du känna till stilleståndstiden ( P ) och den utlovade tillgänglighetstiden ( D ), vid hög tillgänglighet ingår inte den totala planerade stilleståndstiden i denna tid. Då kan tillgänglighetsnivån erhållas med formeln [6] :
tillgänglighet = ( D - P ) / D × 100 %Till exempel, en 45-minuters stilleståndstid med kontinuerlig tillgänglighet i januari indikerar en tillgänglighetsgrad på 99,9 % ("tre nior").
Tillgänglighet kan uttryckas som medelvärden [7] :
genomsnittlig tillgänglighet = MTTF / (MTTF + MTTR) × 100 %,där MTTF ( medeltiden till fel ) är medeltiden till fel , MTTR ( medeltiden för reparation ) är medeltiden till återhämtning .
Återställningstiden efter ett fel beror på många faktorer, såsom systemets komplexitet (ju mer komplext systemet är, desto längre tid tar det att starta om), hur allvarligt problemet är, tillgången på underhållspersonal, reservutrustning, otillräcklig backup , etc. Det bör också noteras att systemtillgänglighet mäts ur användarens synvinkel och inte fastställande av driften av huvudnoderna [6] .
Ett annat tillgänglighetsmått som tillämpas på stora nätverk och deras komponentenheter är metoden som räknar antalet fel per miljon (DPM, engelska defekter per miljon ) timmars drift. Denna metod är mer exakt än procentmetoden, vilket gör att du kan ta hänsyn till fel i driften av en del av nätverket. I det här fallet är det möjligt att mäta nätverkets drifttid som helhet, den totala drifttiden för alla enheter, eller till och med den totala drifttiden för användare [8] .