Informationsenheter används för att mäta olika egenskaper associerade med information .
Oftast gäller mätningen av information mätning av kapaciteten hos datorminne ( lagringsenheter ) och mätning av mängden data som överförs via digitala kommunikationskanaler . Mindre vanligt mätt är mängden information .
En stor mängd data kan innehålla väldigt lite information. Det vill säga mängden data och mängden information är olika egenskaper som används inom olika områden relaterade till information, men historiskt har namnet " mängd information " använts i betydelsen "mängd data" och namnen " informationsentropi " ” och ”informationens värde” användes för att mäta mängden information. ”.
De används för att mäta kapaciteten hos lagringsmedia - lagringsenheter och för att mäta datavolymer .
De används för att mäta mängden information i en datavolym . Informationsentropi
Det primära kännetecknet för mängden data är antalet möjliga tillstånd .
Den primära enheten för mätning av datavolym är 1 möjligt tillstånd (värde, kod).
Den sekundära egenskapen för mängden data är biten .
Kapaciteten (volymen) för en siffra kan vara olika och beror på det använda kodsystemet.
Kapacitet på en siffra i binära, ternära och decimala kodningssystem:
En binär siffra ( bit ) har 2 ömsesidigt uteslutande möjliga tillstånd (värden, koder).
En ternär siffra ( trit ) har 3 ömsesidigt uteslutande möjliga tillstånd (värden, koder).
…
En decimal (decite) har 10 ömsesidigt uteslutande möjliga tillstånd (värden, koder).
…
De tertiära egenskaperna för mängden data är olika uppsättningar av bitar .
Kapaciteten för uppsättningen bitar är lika med antalet möjliga tillstånd för denna uppsättning bitar , som bestäms i kombinatorik , är lika med antalet placeringar med upprepningar och beräknas med formeln:
möjliga tillstånd (koder, värden)var
- antalet möjliga tillstånd för en bit (basen för det valda kodningssystemet), är antalet siffror i uppsättningen siffror .Det vill säga, kapaciteten hos uppsättningen bitar är en exponentiell funktion av antalet bitar med en bas lika med antalet möjliga tillstånd för en bit .
Exempel:
1 byte består av 8 ( ) binära siffror ( ) och kan ta:
möjliga tillstånd (värden, koder).
När vissa kvantiteter, inklusive mängden data, är exponentiella funktioner , är det i många fall bekvämare att inte använda själva kvantiteterna utan logaritmerna för dessa kvantiteter.
Mängden data kan också representeras logaritmiskt, som logaritmen för antalet möjliga tillstånd [1] .
Informationsmängd ( mängd data) - kan mätas logaritmiskt. [2] Detta innebär att när flera objekt behandlas som ett, multipliceras antalet möjliga tillstånd och mängden information läggs till . Det spelar ingen roll om vi pratar om slumpvariabler i matematik, digitala minnesregister inom teknik eller kvantsystem inom fysik.
För binära datavolymer är det bekvämare att använda binära logaritmer.
möjliga tillstånd , binär siffra = 1 bit möjliga tillstånd , bitar = 1 byte ( oktett ) möjliga tillstånd , bitar = 1 KiloByte (KiloOctet) möjliga tillstånd , bitar = 1 megabyte (MegaOctet) möjliga tillstånd , bitar = 1 Gigabyte (GigaOctet) möjliga tillstånd , bitar = 1 TeraByte (TeraOctet)Det minsta heltal vars binära logaritm är ett positivt heltal är 2. Dess motsvarande enhet, bit , är grunden för beräkning av information inom digital teknik.
För ternära datavolymer är det bekvämare att använda ternära logaritmer.
möjliga tillstånd , ternär siffra ( trit ) möjliga tillstånd , ternära siffror ( trit s ) = 1 egenskap .Enheten som motsvarar siffran 3, trit är lika med log 2 3≈1,585 bitar.
En sådan enhet som nat (nat), som motsvarar den naturliga logaritmen , används i tekniska och vetenskapliga beräkningar. I datorteknik används det praktiskt taget inte, eftersom basen för naturliga logaritmer inte är ett heltal.
För volymer av decimaldata är det bekvämare att använda decimallogaritmer.
möjliga tillstånd , decimal = 1 dec möjliga tillstånd , decimaler = 1 kilodecite . möjliga tillstånd , decimaler = 1 megadecite . möjliga tillstånd , decimaler = 1 gigadecite .Enheten som motsvarar talet 10, decit är lika med log 2 10≈3,322 bitar.
Inom trådbunden kommunikationsteknik (telegraf och telefon) och radio fick en informationsenhet historiskt sett för första gången beteckningen baud .
I heltal av binära siffror (bitar) är antalet möjliga tillstånd lika med potenser av två.
Fyra binära siffror (4 bitar) har ett speciellt namn - tetrad , half byte , nibble , som innehåller mängden information som finns i en hexadecimal siffra.
Mätningar i byte | ||||||||
---|---|---|---|---|---|---|---|---|
GOST 8.417-2002 | SI -prefix | IEC -prefix | ||||||
namn | Beteckning | Grad | namn | Grad | namn | Beteckning | Grad | |
byte | B | 10 0 | — | 10 0 | byte | B | B | 20 _ |
kilobyte | KB | 10 3 | kilo- | 10 3 | kibibyte | KiB | KiB | 2 10 |
megabyte | MB | 10 6 | mega- | 10 6 | mebibyte | MiB | MiB | 2 20 |
gigabyte | GB | 10 9 | giga- | 10 9 | gibibyte | GiB | GiB | 2 30 |
terabyte | TB | 10 12 | tera- | 10 12 | tebibyte | TiB | Tib | 2 40 |
petabyte | pb | 10 15 | peta- | 10 15 | pebibyte | PiB | P&B | 2 50 |
exabyte | Ebyte | 10 18 | exa- | 10 18 | exbibyte | EiB | EIB | 2 60 |
zettabyte | Zbyte | 10 21 | zetta- | 10 21 | zebibyte | ZiB | ZiB | 2 70 |
yottabyte | Ibyte | 10 24 | yotta- | 10 24 | yobibyte | YiB | Y&B | 2 80 |
Nästa populära informationsenhet i ordning är 8 bitar eller bytes (de terminologiska subtiliteterna beskrivs nedan ). Det är till en byte (och inte till en bit) som alla stora mängder information som beräknas i datorteknik ges direkt.
Värden som ett maskinord , etc., som utgör flera byte, används nästan aldrig som måttenheter .
För att mäta stor kapacitet av lagringsenheter och stora mängder information som har ett stort antal byte, används enheterna "kilobyte" = [1000] byte och "Kbytes" [3] ( kibibyte , kibibyte) = 1024 byte (ca. förväxling av decimala och binära enheter och termer se nedan ). Denna storleksordning är till exempel:
Mängden information som erhålls genom att läsa en "3.5" högdensitetsdiskett är 1440 KB (exakt) ; även andra format beräknas i helt antal KB.
Enheterna "megabyte" = 1 000 kilobyte = [1 000 000] byte och "mebibyte" [3] (mebibyte) = 1 024 kbyte = 1 048 576 byte används för att mäta volymen av lagringsmedia.
Adressutrymmet för Intel 8086-processorn var 1 MB.
RAM- och CD-ROM- kapacitet mäts i binära enheter (mebibyte, även om de inte brukar kallas det), men för hårddiskkapacitet var decimalmegabyte mer populära.
Moderna hårddiskar har volymer uttryckta i dessa enheter som minst sexsiffriga tal, så gigabyte används för dem.
Enheterna "gigabyte" = 1 000 megabyte = [1 000 000] kilobyte = [1 000 000 000] byte och "GB" [3] ( gibibyte , gibibyte) = 1 024 MB = 230 byte mäter storleken på stora lagringsmedia, såsom hårddiskar . Skillnaden mellan binära och decimala enheter är redan över 7 %.
Storleken på ett 32-bitars adressutrymme är 4 GB ≈ 4,295 MB. Samma storleksordning har storleken på DVD-ROM och moderna media på flashminne . Hårddiskstorlekar når redan hundratals och tusentals gigabyte.
För att räkna ut ännu större mängder information finns det enheter av terabyte och tebibyte (10 12 respektive 2 40 byte), petabyte och pebibyte (10 15 respektive 2 50 byte) osv.
I princip definieras en byte för en viss dator som det minsta minnesadresssteget , vilket på äldre maskiner inte nödvändigtvis var lika med 8 bitar (och minnet är inte nödvändigtvis uppbyggt av bitar - se till exempel: ternär dator ). I modern tradition anses en byte ofta vara lika med åtta bitar .
I sådana beteckningar som byte (ryska) eller B (engelska) betyder byte (B) exakt 8 bitar, även om termen "byte" i sig inte är helt korrekt ur teoretisk synvinkel.
På franska används symbolerna o , Ko , Mo , etc. (från ordet oktett) för att understryka att vi pratar om 8 bitar.
Under lång tid försökte skillnaden mellan faktorerna 1000 och 1024 inte tillmäta stor vikt. För att undvika missförstånd, skillnaden mellan:
dessa enheter är per definition 10 3 , 10 6 , 10 9 byte respektive, och så vidare.
IEC föreslår "kibibyte", "mebibyte", "gibibyte", etc. som termer för "KB", "MB", "GB" etc., men dessa termer kritiseras för att vara outtalbara och finns inte i talat språk tal.
Inom olika områden av datavetenskap är preferenserna för användningen av decimala och binära enheter också olika. Dessutom, även om det har gått flera år sedan standardiseringen av terminologi och beteckningar, försöker de långt ifrån överallt klargöra den exakta innebörden av de enheter som används.
På engelska, för "kibi" \u003d 1024 \u003d 2 10 , används ibland en stor bokstav K , för att understryka skillnaden från prefixet som indikeras av den gemena bokstaven SI kilo . En sådan beteckning är dock inte baserad på en auktoritativ standard, i motsats till den ryska GOST när det gäller "Kbytes".
Informationsenheter | |
---|---|
Basenheter | |
Relaterade enheter | |
Traditionella bitenheter | |
Traditionella byte-enheter | |
IEC bitenheter |
|
IEC -byteenheter |