KOI-8 ( kod för utbyte och information , 8 bitar), KOI8 är en åttabitars ASCII - kompatibel teckentabell . Designad för att koda bokstäver i kyrilliska alfabet . Den användes i stor utsträckning som den huvudsakliga ryska kodningen i Unix -kompatibla operativsystem och i e-post , men närmare 2010 , med spridningen av Unicode , försvinner den gradvis.
Det finns också en sjubitarsversion av kodningen som inte är helt kompatibel med ASCII -KOI-7 . KOI-7 och KOI-8 beskrivs i den nu nedlagda GOST 19768-74.
Utvecklarna av KOI-8 placerade tecknen i det ryska alfabetet i den övre delen av kodtabellen på ett sådant sätt att positionerna för de kyrilliska tecknen motsvarar deras fonetiska motsvarigheter i det engelska alfabetet från botten av tabellen. Detta innebär att om i texten skriven i KOI-8, för varje tecken, en bit tas bort från vänster, kommer en relativt läsbar text, liknande translitteration , att erhållas . Till exempel kommer orden "Russian Text" att bli "rUSSKIJ tEKST". På grund av detta är de kyrilliska tecknen inte i alfabetisk ordning.
Det finns flera varianter av KOI-8-kodning för olika kyrilliska alfabet som utökar vissa koder (det totala intervallet 192-255 med 32 ryska bokstäver i två fall förblir oförändrat i alla varianter). Det ryska alfabetet beskrivs i KOI8-R- kodning , ukrainska - i KOI8-U , Tadzjikiska - i KOI8-T.
På 1990-talet blev KOI8-R de facto-standarden för att koda rysk kyrilliska på UNIX - liknande operativsystem och e- post . Författaren till denna kodning ( RFC 1489 ) Andrey Chernov arbetade i Demos -företaget ( Relcom- nätverket ) i början av 1990-talet och var direkt involverad i lanseringen och justeringen av den första internetkanalen mellan Ryssland och västländerna . KOI-8 blev den första ryska standardiserade kodningen på Internet.
IETF har godkänt flera RFC:er på KOI-8-kodningsalternativ:
IANA har registrerat kodningar i sin lista.
RFC 1489- standarden kräver förekomsten av "box"-grafiska tecken ( pseudographics ), men detta krav uppfylls sällan.
På Microsoft Windows är KOI8-R tilldelad sidkod 20866, KOI8-U är 21866.
Början av kodningstabellen ( latin ) motsvarar helt ASCII - kodningen .
I tabellerna nedan anger siffrorna under bokstäverna Unicode -hexadecimalkoden för bokstaven .
.0 | .ett | .2 | .3 | .fyra | .5 | .6 | .7 | .åtta | .9 | .A | .B | .C | .D | .E | .F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
åtta. |
─ 2500 |
│ 2502 |
┌250C _ |
┐ 2510 |
└ 2514 |
┘ 2518 |
├ 251C |
┤ 2524 |
┬ 252C |
┴ 2534 |
┼ 253C |
▀ 2580 |
▄ 2584 |
█ 2588 |
▌258C _ |
▐ 2590 |
9. |
░ 2591 |
▒ 2592 |
▓ 2593 |
⌠ 2320 |
■ 25A0 |
∙ 2219 |
√ 221A |
≈ 2248 |
≤ 2264 |
≥ 2265 |
A0 |
⌡ 2321 |
° B0 |
²B2 _ |
B7 _ |
÷ F7 |
A. |
═ 2550 |
║ 2551 |
╒ 2552 |
år 451 |
╓ 2553 |
╔ 2554 |
╕ 2555 |
╖ 2556 |
╗ 2557 |
# 2558 |
╙ 2559 |
╚ 255A |
╛255B _ |
╜255C _ |
nr 255D |
nr 255E |
b. |
╟255F _ |
╠ 2560 |
╡ 2561 |
Yo 401 |
╢ 2562 |
╣ 2563 |
╤ 2564 |
╥ 2565 |
╦ 2566 |
nr 2567 |
╨ 2568 |
╩ 2569 |
nr 256A |
nr 256B |
╬ 256C |
© A9 |
C. |
yu 44E |
en 430 |
b 431 |
c 446 |
d 434 |
e 435 |
f 444 |
g 433 |
x 445 |
och 438 |
439 _ |
till 43A |
l 43B |
m 43C |
n 43D |
ca 43E |
D. |
n 43F |
i 44F |
s 440 |
från 441 |
t 442 |
på 443 |
f 436 |
i 432 |
b 44C |
s 44B |
s 437 |
sh 448 |
e 44D |
w 449 |
h 447 |
b 44A |
E. |
Yu 42E |
En 410 |
B 411 |
C 426 |
D 414 |
E 415 |
F 424 |
G 413 |
X 425 |
och 418 |
Y 419 |
K 41A |
L 41B |
M 41C |
H 41D |
Cirka 41E |
F. |
P 41F |
Jag är 42F |
420 kr |
C 421 |
T 422 |
423 _ |
F 416 |
B 412 |
b 42c |
S 42B |
W 417 |
SH 428 |
E 42D |
Shch 429 |
Ch 427 |
b 42A |
Endast icke-matchande tabellrader visas, eftersom allt annat matchar.
.0 | .ett | .2 | .3 | .fyra | .5 | .6 | .7 | .åtta | .9 | .A | .B | .C | .D | .E | .F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
A. |
═ 2550 |
║ 2551 |
╒ 2552 |
år 451 |
$ 454 |
╔ 2554 |
jag 456 |
457 _ |
╗ 2557 |
# 2558 |
╙ 2559 |
╚ 255A |
╛255B _ |
491 _ |
nr 255D |
nr 255E |
b. |
╟255F _ |
╠ 2560 |
╡ 2561 |
Yo 401 |
Є 404 |
╣ 2563 |
Jag 406 |
407 pund |
╦ 2566 |
nr 2567 |
╨ 2568 |
╩ 2569 |
nr 256A |
Ґ 490 |
╬ 256C |
© A9 |
.0 | .ett | .2 | .3 | .fyra | .5 | .6 | .7 | .åtta | .9 | .A | .B | .C | .D | .E | .F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
A. |
═ 2550 |
║ 2551 |
╒ 2552 |
år 451 |
$ 454 |
╔ 2554 |
jag 456 |
457 _ |
╗ 2557 |
# 2558 |
╙ 2559 |
╚ 255A |
╛255B _ |
491 _ |
¢ 45E |
nr 255E |
b. |
╟255F _ |
╠ 2560 |
╡ 2561 |
Yo 401 |
Є 404 |
╣ 2563 |
Jag 406 |
407 pund |
╦ 2566 |
nr 2567 |
╨ 2568 |
╩ 2569 |
nr 256A |
Ґ 490 |
Î 40E |
© A9 |
.0 | .ett | .2 | .3 | .fyra | .5 | .6 | .7 | .åtta | .9 | .A | .B | .C | .D | .E | .F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
åtta. | - 493 |
497 _ |
49B _ |
49D _ |
n 4A3 |
- 4AF |
- 4B1 |
h 4B3 |
ҷ 4B7 |
nr 4B9 |
h 4BB |
▀ 2580 |
4D9 _ |
ӣ 4E3 |
4E9 _ |
ӯ 4Eо |
9. | 492 _ |
496 _ |
K 49A |
49C _ |
Ң 4A2 |
- 4AE |
Ұ 4B0 |
- 4B2 |
- 4B6 |
- 4B8 |
4BA _ |
⌡ 2321 |
4D8 _ |
Ӣ 4E2 |
Ө 4E8 |
4EE _ |
A. | A0 |
$ 452 |
-453 _ |
år 451 |
$ 454 |
* 455 |
jag 456 |
457 _ |
$ 458 |
459 _ |
њ 45A |
ћ 45B |
ќ 45C |
491 _ |
¢ 45E |
џ 45F |
b. | nr 2116 |
402 € |
Ѓ 403 |
Yo 401 |
Є 404 |
S 405 |
Jag 406 |
407 pund |
408 pund |
409 pund |
Њ40A _ |
40 miljarder pund |
40C _ |
Ґ 490 |
Î 40E |
Џ 40F |
.0 | .ett | .2 | .3 | .fyra | .5 | .6 | .7 | .åtta | .9 | .A | .B | .C | .D | .E | .F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
203A}} | nr 045A |
ќ 045C |
ћ 045B |
џ 045F | ||||||||||||
Î 040E |
© 00A9 |
.0 | .ett | .2 | .3 | .fyra | .5 | .6 | .7 | .åtta | .9 | .A | .B | .C | .D | .E | .F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
A. |
00A0 |
0452 $ |
- 0453 |
e 0451 |
є 0454 |
* 0455 |
jag 0456 |
ї 0457 |
$ 0458 |
љ 0459 |
nr 045A |
ћ 045B |
ќ 045C |
00 e.Kr |
¢ 045E |
џ 045F |
b. |
nr 2116 |
0402 € |
Ѓ 0403 |
Yo 0401 |
Є 0404 |
S 0405 |
I 0406 |
£ 0407 |
£ 0408 |
Љ 0409 |
Њ 040A |
040 miljarder pund |
nr 040C |
¤ 00A4 |
Î 040E |
P 040F |
KOI8-Unified (KOI8-F)-kodningen föreslogs av Fingertip Software [1] .
.0 | .ett | .2 | .3 | .fyra | .5 | .6 | .7 | .åtta | .9 | .A | .B | .C | .D | .E | .F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
åtta. |
─ 2500 |
│ 2502 |
┌250C _ |
┐ 2510 |
└ 2514 |
┘ 2518 |
├ 251C |
┤ 2524 |
┬ 252C |
┴ 2534 |
┼ 253C |
▀ 2580 |
▄ 2584 |
█ 2588 |
▌258C _ |
▐ 2590 |
9. |
░ 2591 |
' 2018 |
' 2019 |
" 201C |
” 201D |
• 2022 |
– 2013 |
— 2014 |
© 00A9 |
™ 2122 |
00A0 |
» 00BB |
® 00AE |
« 00AB |
00B7 _ |
¤ 00A4 |
A. |
00A0 |
0452 $ |
- 0453 |
e 0451 |
є 0454 |
* 0455 |
jag 0456 |
ї 0457 |
$ 0458 |
љ 0459 |
nr 045A |
ћ 045B |
ќ 045C |
ґ 0491 |
¢ 045E |
џ 045F |
b. |
nr 2116 |
0402 € |
Ѓ 0403 |
Yo 0401 |
Є 0404 |
S 0405 |
I 0406 |
£ 0407 |
£ 0408 |
Љ 0409 |
Њ 040A |
040 miljarder pund |
nr 040C |
Ґ 0490 |
Î 040E |
P 040F |
I vissa CMEA-länder skapades modifieringar av KOI-8 för nationella varianter av det latinska alfabetet . Grundtanken var densamma - när man "klipper av" den åttonde biten ska texten förbli mer eller mindre tydlig.
Teckenkodningar | |
---|---|
Historiska kodningar | ytterligare komp. semafor (Makarov) morse Bodo MTK-2 komp. 6-bitars SCP RADIX-50 EBCDIC KOI-7 ISO 646 |
modern 8-bitars representation | symboler ASCII icke-ASCII 8-bitars kodsidor Kyrillisk KOI-8 Grundläggande kodning MacCyrillic ISO 8859 1 (lat.) 2 3 fyra 5 (kir.) 6 7 åtta 9 tio elva 12 13 fjorton 15 (€) 16 Windows 1250 1251 (Kir.) 1252 1253 1254 1255 1256 1257 1258 WGL4 IBM & DOS 437 850 852 855 866 "alternativ" MIC |
Multibyte | traditionell DBCS GB2312 HTML unicode UTF-32 UTF-16 UTF-8 teckenlista Kyrillisk |
användargränssnitt tangentbordslayout plats linjeöversättning font translitterering anpassade typsnitt verktyg iconv spela in |