Code page ( engelsk code page ) - en tabell som matchar varje bytevärde med ett visst tecken (eller dess frånvaro). Vanligtvis är en teckenkod 8 bitar stor , så en teckentabell kan innehålla högst 256 tecken, vilket innebär att varje 8-bitars teckentabell är allvarligt otillräcklig för att representera flerspråkig text. Dessutom används vissa tecken som kontrolltecken , varför antalet utskrivna tecken sällan överstiger 223 [1] .
Historiskt sett introducerades termen teckentabell av IBM Corporation ; utbytbara teckentabeller användes för att stödja olika språk (med alfabetiska skrivsystem). På senare tid har det förekommit förvirring mellan termen "kodtabell" och den mer allmänna uppfattningen om en teckenuppsättning (kodning).
För närvarande används huvudsakligen två typer av kodningar: ASCII -kompatibla och EBCDIC -kompatibla [2] , med den förra övervägande dominerande. I ASCII-kompatibla kodningar är koder för 95 utskrivbara tecken och 33 kontrolltecken fasta, och de återstående 128 kodpunkterna används för olika icke-ASCII-tecken.
För att koda texter på ryska (det vill säga kyrilliska bokstäver ) används följande teckentabeller mest:
Att använda olika teckentabeller skapar en hel del besvär för både användare och programmerare. När du försöker läsa en textfil med en teckentabell som är inkompatibel med den där den skapades, finns det buggar . På senare år har Unicode blivit utbredd som ett alternativ till traditionella teckentabeller.
På Microsoft Windows-system är teckentabeller en viktig komponent i lokalisering , som anges i HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Control\Nls\CodePage\ [3] registernycklar .
Historiskt sett (i Windows 3.x- och Windows 9x-system ) fanns det två typer av teckentabeller. ANSI-teckentabeller [4] (eng. ANSI-teckentabell , i registret: ACP ), även kallade Windows [5] är inbyggda Windows-teckentabeller. De innehåller många typografiska tecken , men nästan ingen pseudografi på grund av att de är avsedda att användas i en grafisk miljö. Microsoft erkände senare att användningen av ANSI- namnet berodde på ett missförstånd. [6] "ANSI"/Windows-kodningar inkluderar i synnerhet Windows-1252 och ovannämnda Windows-1251 . Microsoft hänvisar också till teckentabeller som kodtabeller, av vilka vissa positioner kräver en andra (terminal) byte för att bilda ett tecken, det vill säga de som tillåter en två-byte representation av vissa tecken [7] , även om de strängt taget är redan teckenkodningar med variabel längd.
OEM-kodningarna (eng. OEM-kodsida , i registret: OEMCP ) är baserade på CP437 och innehåller VGA -kompatibel pseudografik . Ovanstående alternativa kodning är känd som CP866 på Windows .
Från och med Windows NT dök en tredje klass av teckentabeller upp: Macintosh-kodningar (engelska Macintosh-kodtabellen , i registret: MACCP ), kompatibla med MacOS .
Teckenkodningar | |
---|---|
Historiska kodningar | ytterligare komp. semafor (Makarov) morse Bodo MTK-2 komp. 6-bitars SCP RADIX-50 EBCDIC KOI-7 ISO 646 |
modern 8-bitars representation | symboler ASCII icke-ASCII 8-bitars kodsidor Kyrillisk KOI-8 Grundläggande kodning MacCyrillic ISO 8859 1 (lat.) 2 3 fyra 5 (kir.) 6 7 åtta 9 tio elva 12 13 fjorton 15 (€) 16 Windows 1250 1251 (Kir.) 1252 1253 1254 1255 1256 1257 1258 WGL4 IBM & DOS 437 850 852 855 866 "alternativ" MIC |
Multibyte | traditionell DBCS GB2312 HTML unicode UTF-32 UTF-16 UTF-8 teckenlista Kyrillisk |
användargränssnitt tangentbordslayout plats linjeöversättning font translitterering anpassade typsnitt verktyg iconv spela in |
Typgjuteri och typdesign | |||||||||
---|---|---|---|---|---|---|---|---|---|
Begrepp | |||||||||
Teckensnittsstruktur |
| ||||||||
Teckensnittsegenskaper | |||||||||
Klassificering av alfabetiska teckensnitt |
| ||||||||
Teckensnittsstilar | |||||||||
Enheter | |||||||||
datortypografi _ | |||||||||
se även förlag Tryckeri Typografi Utrustning Layout Utskrift |