Måttenheter för mediakapacitet och informationsvolym

Informationsenheter används för att mäta olika egenskaper associerade med information .

Oftast gäller mätningen av information mätning av kapaciteten hos datorminne ( lagringsenheter ) och mätning av mängden data som överförs via digitala kommunikationskanaler . Mindre vanligt mätt är mängden information .

Informationsenheter

En stor mängd data kan innehålla väldigt lite information. Det vill säga mängden data och mängden information är olika egenskaper som används inom olika områden relaterade till information, men historiskt har namnet " mängd information " använts i betydelsen "mängd data" och namnen " informationsentropi " ” och ”informationens värde” användes för att mäta mängden information. ”.

Enheter för lagringskapacitet och datavolym

De används för att mäta kapaciteten hos lagringsmedia - lagringsenheter och för att mäta datavolymer .

Enheter för att mäta mängden information

De används för att mäta mängden information i en datavolym . Informationsentropi

Primär enhet

Det primära kännetecknet för mängden data är antalet möjliga tillstånd .

Den primära enheten för mätning av datavolym är 1 möjligt tillstånd (värde, kod).

Sekundära enheter

Den sekundära egenskapen för mängden data är biten .

Kapaciteten (volymen) för en siffra kan vara olika och beror på det använda kodsystemet.

Kapacitet på en siffra i binära, ternära och decimala kodningssystem:

En binär siffra ( bit ) har 2 ömsesidigt uteslutande möjliga tillstånd (värden, koder).

En ternär siffra ( trit ) har 3 ömsesidigt uteslutande möjliga tillstånd (värden, koder).

…

En decimal (decite) har 10 ömsesidigt uteslutande möjliga tillstånd (värden, koder).

…

Tertiära enheter

De tertiära egenskaperna för mängden data är olika uppsättningar av bitar .

Kapaciteten för uppsättningen bitar är lika med antalet möjliga tillstånd för denna uppsättning bitar , som bestäms i kombinatorik , är lika med antalet placeringar med upprepningar och beräknas med formeln:

{\bar {A}}(c,n)={\bar {A}}_{c}^{n}=c^{n}

möjliga tillstånd (koder, värden)

var

c

- antalet möjliga tillstånd för en bit (basen för det valda kodningssystemet),

n

är antalet siffror i uppsättningen siffror .

Det vill säga, kapaciteten hos uppsättningen bitar är en exponentiell funktion av antalet bitar med en bas lika med antalet möjliga tillstånd för en bit .

Exempel:

1 byte består av 8 ( ) binära siffror ( ) och kan ta: $n=8$ $c=2$

${\bar {A}}_{c}^{n}=c^{n}=2^{8}=256$ möjliga tillstånd (värden, koder).

Logaritmiska enheter

När vissa kvantiteter, inklusive mängden data, är exponentiella funktioner , är det i många fall bekvämare att inte använda själva kvantiteterna utan logaritmerna för dessa kvantiteter.

Mängden data kan också representeras logaritmiskt, som logaritmen för antalet möjliga tillstånd [1] .

Informationsmängd ( mängd data) - kan mätas logaritmiskt. [2] Detta innebär att när flera objekt behandlas som ett, multipliceras antalet möjliga tillstånd och mängden information läggs till . Det spelar ingen roll om vi pratar om slumpvariabler i matematik, digitala minnesregister inom teknik eller kvantsystem inom fysik.

För binära datavolymer är det bekvämare att använda binära logaritmer.

2^{1}

möjliga tillstånd , binär siffra = 1 bit

\log _{2}2^{1}=1

2^{{8}}

möjliga tillstånd , bitar = 1 byte ( oktett )

\log _{2}2^{8}=8=2^{3}

2^{8*2^{10}}

möjliga tillstånd , bitar = 1 KiloByte (KiloOctet)

\log _{2}2^{8*2^{10}}=8*2^{10}=2^{13}

2^{8*2^{20}}

möjliga tillstånd , bitar = 1 megabyte (MegaOctet)

\log _{2}2^{8*2^{20}}=8*2^{20}=2^{23}

2^{8*2^{30}}

möjliga tillstånd , bitar = 1 Gigabyte (GigaOctet)

\log _{2}2^{8*2^{30}}=8*2^{30}=2^{33}

2^{8*2^{40}}

möjliga tillstånd , bitar = 1 TeraByte (TeraOctet)

\log _{2}2^{8*2^{40}}=8*2^{40}=2^{43}

Det minsta heltal vars binära logaritm är ett positivt heltal är 2. Dess motsvarande enhet, bit , är grunden för beräkning av information inom digital teknik.

För ternära datavolymer är det bekvämare att använda ternära logaritmer.

3^{1}=3

möjliga tillstånd , ternär siffra ( trit )

\log _{3}3^{1}=1

3^{6}=729

möjliga tillstånd , ternära siffror ( trit s ) = 1 egenskap .

\log _{3}3^{6}=6

Enheten som motsvarar siffran 3, trit är lika med log 2 3≈1,585 bitar.

En sådan enhet som nat (nat), som motsvarar den naturliga logaritmen , används i tekniska och vetenskapliga beräkningar. I datorteknik används det praktiskt taget inte, eftersom basen för naturliga logaritmer inte är ett heltal.

För volymer av decimaldata är det bekvämare att använda decimallogaritmer.

10^{1}=10

möjliga tillstånd , decimal = 1 dec

\log _{10}10^{1}=1

10^{10^{3}}

möjliga tillstånd , decimaler = 1 kilodecite .

\log _{10}10^{10^{3}}=10^{3}

10^{10^{6}}

möjliga tillstånd , decimaler = 1 megadecite .

\log _{10}10^{10^{6}}=10^{6}

10^{10^{9}}

möjliga tillstånd , decimaler = 1 gigadecite .

\log _{10}10^{10^{9}}=10^{9}

Enheten som motsvarar talet 10, decit är lika med log 2 10≈3,322 bitar.

Inom trådbunden kommunikationsteknik (telegraf och telefon) och radio fick en informationsenhet historiskt sett för första gången beteckningen baud .

Bithärledda enheter

I heltal av binära siffror (bitar) är antalet möjliga tillstånd lika med potenser av två.

Tetrad, knapra, knapra

Fyra binära siffror (4 bitar) har ett speciellt namn - tetrad , half byte , nibble , som innehåller mängden information som finns i en hexadecimal siffra.

Byte

Mätningar i byte
GOST 8.417-2002			SI -prefix		IEC -prefix
namn	Beteckning	Grad	namn	Grad	namn	Beteckning		Grad
byte	B	10 0	—	10 0	byte	B	B	20 _
kilobyte	KB	10 3	kilo-	10 3	kibibyte	KiB	KiB	2 10
megabyte	MB	10 6	mega-	10 6	mebibyte	MiB	MiB	2 20
gigabyte	GB	10 9	giga-	10 9	gibibyte	GiB	GiB	2 30
terabyte	TB	10 12	tera-	10 12	tebibyte	TiB	Tib	2 40
petabyte	pb	10 15	peta-	10 15	pebibyte	PiB	P&B	2 50
exabyte	Ebyte	10 18	exa-	10 18	exbibyte	EiB	EIB	2 60
zettabyte	Zbyte	10 21	zetta-	10 21	zebibyte	ZiB	ZiB	2 70
yottabyte	Ibyte	10 24	yotta-	10 24	yobibyte	YiB	Y&B	2 80

Nästa populära informationsenhet i ordning är 8 bitar eller bytes (de terminologiska subtiliteterna beskrivs nedan ). Det är till en byte (och inte till en bit) som alla stora mängder information som beräknas i datorteknik ges direkt.

Värden som ett maskinord , etc., som utgör flera byte, används nästan aldrig som måttenheter .

Kilobyte

För att mäta stor kapacitet av lagringsenheter och stora mängder information som har ett stort antal byte, används enheterna "kilobyte" = [1000] byte och "Kbytes" [3] ( kibibyte , kibibyte) = 1024 byte (ca. förväxling av decimala och binära enheter och termer se nedan ). Denna storleksordning är till exempel:

En disksektor är vanligtvis lika med 512 byte, det vill säga en halv KB, även om det för vissa enheter kan vara lika med en eller två kibibyte.
Den klassiska "block"-storleken i UNIX -filsystem är en KB (1024 byte).
En "minnessida" i x86-processorer (som börjar med Intel 80386- modellen ) är 4096 byte, det vill säga 4 KB.

Mängden information som erhålls genom att läsa en "3.5" högdensitetsdiskett är 1440 KB (exakt) ; även andra format beräknas i helt antal KB.

Megabyte

Enheterna "megabyte" = 1 000 kilobyte = [1 000 000] byte och "mebibyte" [3] (mebibyte) = 1 024 kbyte = 1 048 576 byte används för att mäta volymen av lagringsmedia.

Adressutrymmet för Intel 8086-processorn var 1 MB.

RAM- och CD-ROM- kapacitet mäts i binära enheter (mebibyte, även om de inte brukar kallas det), men för hårddiskkapacitet var decimalmegabyte mer populära.

Moderna hårddiskar har volymer uttryckta i dessa enheter som minst sexsiffriga tal, så gigabyte används för dem.

Gigabyte

Enheterna "gigabyte" = 1 000 megabyte = [1 000 000] kilobyte = [1 000 000 000] byte och "GB" [3] ( gibibyte , gibibyte) = 1 024 MB = 230 byte mäter storleken på stora lagringsmedia, såsom hårddiskar . Skillnaden mellan binära och decimala enheter är redan över 7 %.

Storleken på ett 32-bitars adressutrymme är 4 GB ≈ 4,295 MB. Samma storleksordning har storleken på DVD-ROM och moderna media på flashminne . Hårddiskstorlekar når redan hundratals och tusentals gigabyte.

För att räkna ut ännu större mängder information finns det enheter av terabyte och tebibyte (10 12 respektive 2 40 byte), petabyte och pebibyte (10 15 respektive 2 50 byte) osv.

Vad är "byte"?

I princip definieras en byte för en viss dator som det minsta minnesadresssteget , vilket på äldre maskiner inte nödvändigtvis var lika med 8 bitar (och minnet är inte nödvändigtvis uppbyggt av bitar - se till exempel: ternär dator ). I modern tradition anses en byte ofta vara lika med åtta bitar .

I sådana beteckningar som byte (ryska) eller B (engelska) betyder byte (B) exakt 8 bitar, även om termen "byte" i sig inte är helt korrekt ur teoretisk synvinkel.

På franska används symbolerna o , Ko , Mo , etc. (från ordet oktett) för att understryka att vi pratar om 8 bitar.

Vad är "kilo"?

Under lång tid försökte skillnaden mellan faktorerna 1000 och 1024 inte tillmäta stor vikt. För att undvika missförstånd, skillnaden mellan:

binära multipla enheter, betecknade enligt GOST 8.417-2002 som "KB", "MB", "GB", etc. (två i potenser av en multipel av tio);
enheter av kilobyte , megabyte , gigabyte etc., förstås som vetenskapliga termer (tio i potenser av tre),

dessa enheter är per definition 10 3 , 10 6 , 10 9 byte respektive, och så vidare.

IEC föreslår "kibibyte", "mebibyte", "gibibyte", etc. som termer för "KB", "MB", "GB" etc., men dessa termer kritiseras för att vara outtalbara och finns inte i talat språk tal.

Inom olika områden av datavetenskap är preferenserna för användningen av decimala och binära enheter också olika. Dessutom, även om det har gått flera år sedan standardiseringen av terminologi och beteckningar, försöker de långt ifrån överallt klargöra den exakta innebörden av de enheter som används.

På engelska, för "kibi" \u003d 1024 \u003d 2 10 , används ibland en stor bokstav K , för att understryka skillnaden från prefixet som indikeras av den gemena bokstaven SI kilo . En sådan beteckning är dock inte baserad på en auktoritativ standard, i motsats till den ryska GOST när det gäller "Kbytes".

Variationer

Anteckningar

↑ "logaritm" på answers.com Arkiverad 22 september 2008 på Wayback Machine
↑ Ur fysikens synvinkel är mängden information (såväl som entropi nära den i betydelse ) dimensionslös . I praktiken, som vid mätning av dimensionslösa vinklar , används olika praktiskt bekväma enheter.
↑ 1 2 3 GOST 8.417-2002 "Mängdenheter" . Hämtad 11 juni 2008. Arkiverad från originalet 2 februari 2012. (obestämd)

Se även

Informationsenheter
Basenheter	Bit qubit Behandla Kutrit
Relaterade enheter	Byte Drag Knapra Ord Oktett
Traditionella bitenheter	kilobit megabit Gigabit Terabit Petabit Exabit Zettabit Yottabit
Traditionella byte-enheter	Kilobyte Megabyte gigabyte Terabyte Petabyte exabyte Zettabyte Yottabyte
IEC bitenheter	Kibibit Mebibit Gibibit Tebibit Pebibit Exbibit Zebibit Jobibit
IEC -byteenheter	Kibibyte Mebibyte Gibibyte Tebibyte Pebibyte Exbibyte Zebibyte Yobibyte