Måttenheter för mediakapacitet och informationsvolym

Informationsenheter används för att mäta olika egenskaper associerade med information .

Oftast gäller mätningen av information mätning av kapaciteten hos datorminne ( lagringsenheter ) och mätning av mängden data som överförs via digitala kommunikationskanaler . Mindre vanligt mätt är mängden information .

Informationsenheter

En stor mängd data kan innehålla väldigt lite information. Det vill säga mängden data och mängden information är olika egenskaper som används inom olika områden relaterade till information, men historiskt har namnet " mängd information " använts i betydelsen "mängd data" och namnen " informationsentropi " ” och ”informationens värde” användes för att mäta mängden information. ”.

Enheter för lagringskapacitet och datavolym

De används för att mäta kapaciteten hos lagringsmedia - lagringsenheter och för att mäta datavolymer .

Enheter för att mäta mängden information

De används för att mäta mängden information i en datavolym . Informationsentropi

Primär enhet

Det primära kännetecknet för mängden data är antalet möjliga tillstånd .

Den primära enheten för mätning av datavolym är 1 möjligt tillstånd (värde, kod).

Sekundära enheter

Den sekundära egenskapen för mängden data är biten .

Kapaciteten (volymen) för en siffra kan vara olika och beror på det använda kodsystemet.

Kapacitet på en siffra i binära, ternära och decimala kodningssystem:

En binär siffra ( bit ) har 2 ömsesidigt uteslutande möjliga tillstånd (värden, koder).

En ternär siffra ( trit ) har 3 ömsesidigt uteslutande möjliga tillstånd (värden, koder).

En decimal (decite) har 10 ömsesidigt uteslutande möjliga tillstånd (värden, koder).

Tertiära enheter

De tertiära egenskaperna för mängden data är olika uppsättningar av bitar .

Kapaciteten för uppsättningen bitar är lika med antalet möjliga tillstånd för denna uppsättning bitar , som bestäms i kombinatorik , är lika med antalet placeringar med upprepningar och beräknas med formeln:

möjliga tillstånd (koder, värden)

var

 - antalet möjliga tillstånd för en bit (basen för det valda kodningssystemet),  är antalet siffror i uppsättningen siffror .

Det vill säga, kapaciteten hos uppsättningen bitar är en exponentiell funktion av antalet bitar med en bas lika med antalet möjliga tillstånd för en bit .

Exempel:

1 byte består av 8 ( ) binära siffror ( ) och kan ta:

möjliga tillstånd (värden, koder).

Logaritmiska enheter

När vissa kvantiteter, inklusive mängden data, är exponentiella funktioner , är det i många fall bekvämare att inte använda själva kvantiteterna utan logaritmerna för dessa kvantiteter.

Mängden data kan också representeras logaritmiskt, som logaritmen för antalet möjliga tillstånd [1] .

Informationsmängd ( mängd data) - kan mätas logaritmiskt. [2] Detta innebär att när flera objekt behandlas som ett, multipliceras antalet möjliga tillstånd och mängden information läggs till . Det spelar ingen roll om vi pratar om slumpvariabler i matematik, digitala minnesregister inom teknik eller kvantsystem inom fysik.

För binära datavolymer är det bekvämare att använda binära logaritmer.

möjliga tillstånd , binär siffra = 1 bit möjliga tillstånd , bitar = 1 byte ( oktett ) möjliga tillstånd , bitar = 1 KiloByte (KiloOctet) möjliga tillstånd , bitar = 1 megabyte (MegaOctet) möjliga tillstånd , bitar = 1 Gigabyte (GigaOctet) möjliga tillstånd , bitar = 1 TeraByte (TeraOctet)

Det minsta heltal vars binära logaritm är ett positivt heltal är 2. Dess motsvarande enhet, bit  , är grunden för beräkning av information inom digital teknik.

För ternära datavolymer är det bekvämare att använda ternära logaritmer.

möjliga tillstånd , ternär siffra ( trit ) möjliga tillstånd , ternära siffror ( trit s ) = 1 egenskap .

Enheten som motsvarar siffran 3, trit är lika med log 2 3≈1,585 bitar.

En sådan enhet som nat (nat), som motsvarar den naturliga logaritmen , används i tekniska och vetenskapliga beräkningar. I datorteknik används det praktiskt taget inte, eftersom basen för naturliga logaritmer inte är ett heltal.

För volymer av decimaldata är det bekvämare att använda decimallogaritmer.

möjliga tillstånd , decimal = 1 dec möjliga tillstånd , decimaler = 1 kilodecite . möjliga tillstånd , decimaler = 1 megadecite . möjliga tillstånd , decimaler = 1 gigadecite .

Enheten som motsvarar talet 10, decit är lika med log 2 10≈3,322 bitar.

Inom trådbunden kommunikationsteknik (telegraf och telefon) och radio fick en informationsenhet historiskt sett för första gången beteckningen baud .

Bithärledda enheter

I heltal av binära siffror (bitar) är antalet möjliga tillstånd lika med potenser av två.

Tetrad, knapra, knapra

Fyra binära siffror (4 bitar) har ett speciellt namn - tetrad , half byte , nibble , som innehåller mängden information som finns i en hexadecimal siffra.

Byte

Mätningar i byte
GOST 8.417-2002 SI -prefix IEC -prefix
namn Beteckning Grad namn Grad namn Beteckning Grad
byte B 10 0 10 0 byte B B 20 _
kilobyte KB 10 3 kilo- 10 3 kibibyte KiB KiB 2 10
megabyte MB 10 6 mega- 10 6 mebibyte MiB MiB 2 20
gigabyte GB 10 9 giga- 10 9 gibibyte GiB GiB 2 30
terabyte TB 10 12 tera- 10 12 tebibyte TiB Tib 2 40
petabyte pb 10 15 peta- 10 15 pebibyte PiB P&B 2 50
exabyte Ebyte 10 18 exa- 10 18 exbibyte EiB EIB 2 60
zettabyte Zbyte 10 21 zetta- 10 21 zebibyte ZiB ZiB 2 70
yottabyte Ibyte 10 24 yotta- 10 24 yobibyte YiB Y&B 2 80

Nästa populära informationsenhet i ordning är 8 bitar eller bytes (de terminologiska subtiliteterna beskrivs nedan ). Det är till en byte (och inte till en bit) som alla stora mängder information som beräknas i datorteknik ges direkt.

Värden som ett maskinord , etc., som utgör flera byte, används nästan aldrig som måttenheter .

Kilobyte

För att mäta stor kapacitet av lagringsenheter och stora mängder information som har ett stort antal byte, används enheterna "kilobyte" = [1000] byte och "Kbytes" [3] ( kibibyte , kibibyte) = 1024 byte (ca. förväxling av decimala och binära enheter och termer se nedan ). Denna storleksordning är till exempel:

Mängden information som erhålls genom att läsa en "3.5" högdensitetsdiskett är 1440 KB (exakt) ; även andra format beräknas i helt antal KB.

Megabyte

Enheterna "megabyte" = 1 000 kilobyte = [1 000 000] byte och "mebibyte" [3] (mebibyte) = 1 024 kbyte = 1 048 576 byte används för att mäta volymen av lagringsmedia.

Adressutrymmet för Intel 8086-processorn var 1 MB.

RAM- och CD-ROM- kapacitet mäts i binära enheter (mebibyte, även om de inte brukar kallas det), men för hårddiskkapacitet var decimalmegabyte mer populära.

Moderna hårddiskar har volymer uttryckta i dessa enheter som minst sexsiffriga tal, så gigabyte används för dem.

Gigabyte

Enheterna "gigabyte" = 1 000 megabyte = [1 000 000] kilobyte = [1 000 000 000] byte och "GB" [3] ( gibibyte , gibibyte) = 1 024 MB = 230 byte mäter storleken på stora lagringsmedia, såsom hårddiskar . Skillnaden mellan binära och decimala enheter är redan över 7 %.

Storleken på ett 32-bitars adressutrymme är 4 GB ≈ 4,295 MB. Samma storleksordning har storleken på DVD-ROM och moderna media på flashminne . Hårddiskstorlekar når redan hundratals och tusentals gigabyte.

För att räkna ut ännu större mängder information finns det enheter av terabyte och tebibyte (10 12 respektive 2 40 byte), petabyte och pebibyte (10 15 respektive 2 50 byte) osv.

Vad är "byte"?

I princip definieras en byte för en viss dator som det minsta minnesadresssteget , vilket på äldre maskiner inte nödvändigtvis var lika med 8 bitar (och minnet är inte nödvändigtvis uppbyggt av bitar - se till exempel: ternär dator ). I modern tradition anses en byte ofta vara lika med åtta bitar .

I sådana beteckningar som byte (ryska) eller B (engelska) betyder byte (B) exakt 8 bitar, även om termen "byte" i sig inte är helt korrekt ur teoretisk synvinkel.

franska används symbolerna o , Ko , Mo , etc. (från ordet oktett) för att understryka att vi pratar om 8 bitar.

Vad är "kilo"?

Under lång tid försökte skillnaden mellan faktorerna 1000 och 1024 inte tillmäta stor vikt. För att undvika missförstånd, skillnaden mellan:

dessa enheter är per definition 10 3 , 10 6 , 10 9 byte respektive, och så vidare.

IEC föreslår "kibibyte", "mebibyte", "gibibyte", etc. som termer för "KB", "MB", "GB" etc., men dessa termer kritiseras för att vara outtalbara och finns inte i talat språk tal.

Inom olika områden av datavetenskap är preferenserna för användningen av decimala och binära enheter också olika. Dessutom, även om det har gått flera år sedan standardiseringen av terminologi och beteckningar, försöker de långt ifrån överallt klargöra den exakta innebörden av de enheter som används.

engelska, för "kibi" \u003d 1024 \u003d 2 10 , används ibland en stor bokstav K , för att understryka skillnaden från prefixet som indikeras av den gemena bokstaven SI kilo . En sådan beteckning är dock inte baserad på en auktoritativ standard, i motsats till den ryska GOST när det gäller "Kbytes".

Variationer

Anteckningar

  1. "logaritm" på answers.com Arkiverad 22 september 2008 på Wayback Machine 
  2. ↑ Ur fysikens synvinkel är mängden information (såväl som entropi nära den i betydelse ) dimensionslös . I praktiken, som vid mätning av dimensionslösa vinklar , används olika praktiskt bekväma enheter.
  3. 1 2 3 GOST 8.417-2002 "Mängdenheter" . Hämtad 11 juni 2008. Arkiverad från originalet 2 februari 2012.

Se även