KOI-8

Den aktuella versionen av sidan har ännu inte granskats av erfarna bidragsgivare och kan skilja sig väsentligt från versionen som granskades den 21 november 2019; kontroller kräver 8 redigeringar .

KOI-8 ( kod för utbyte och information , 8 bitar), KOI8  är en åttabitars ASCII - kompatibel teckentabell . Designad för att koda bokstäver i kyrilliska alfabet . Den användes i stor utsträckning som den huvudsakliga ryska kodningen i Unix -kompatibla operativsystem och i e-post , men närmare 2010 , med spridningen av Unicode , försvinner den gradvis.

Det finns också en sjubitarsversion av kodningen som inte är helt kompatibel med ASCII -KOI-7 . KOI-7 och KOI-8 beskrivs i den nu nedlagda GOST 19768-74.

Utvecklarna av KOI-8 placerade tecknen i det ryska alfabetet i den övre delen av kodtabellen på ett sådant sätt att positionerna för de kyrilliska tecknen motsvarar deras fonetiska motsvarigheter i det engelska alfabetet från botten av tabellen. Detta innebär att om i texten skriven i KOI-8, för varje tecken, en bit tas bort från vänster, kommer en relativt läsbar text, liknande translitteration , att erhållas . Till exempel kommer orden "Russian Text" att bli "rUSSKIJ tEKST". På grund av detta är de kyrilliska tecknen inte i alfabetisk ordning.

Det finns flera varianter av KOI-8-kodning för olika kyrilliska alfabet som utökar vissa koder (det totala intervallet 192-255 med 32 ryska bokstäver i två fall förblir oförändrat i alla varianter). Det ryska alfabetet beskrivs i KOI8-R- kodning , ukrainska - i KOI8-U , Tadzjikiska - i KOI8-T.

På 1990-talet blev KOI8-R de facto-standarden för att koda rysk kyrilliska på UNIX - liknande operativsystem och e- post . Författaren till denna kodning ( RFC 1489Andrey Chernov arbetade i Demos -företaget ( Relcom- nätverket ) i början av 1990-talet och var direkt involverad i lanseringen och justeringen av den första internetkanalen mellan Ryssland och västländerna . KOI-8 blev den första ryska standardiserade kodningen på Internet.

IETF har godkänt flera RFC:er på KOI-8-kodningsalternativ:

IANA har registrerat kodningar i sin lista.

RFC 1489- standarden kräver förekomsten av "box"-grafiska tecken ( pseudographics ), men detta krav uppfylls sällan.

Microsoft Windows är KOI8-R tilldelad sidkod 20866, KOI8-U är 21866.

Början av kodningstabellen ( latin ) motsvarar helt ASCII - kodningen .

I tabellerna nedan anger siffrorna under bokstäverna Unicode -hexadecimalkoden för bokstaven .

Kodning KOI8-R (ryska)

.0 .ett .2 .3 .fyra .5 .6 .7 .åtta .9 .A .B .C .D .E .F
 
åtta.
 

2500

2502
┌250C
_

2510

2514

2518

251C

2524

252C

2534

253C

2580

2584

2588
▌258C
_

2590
 
9.
 

2591

2592

2593

2320

25A0

2219

221A

2248

2264

2265
 
A0

2321
°
B0
²B2
_
B7
_
÷
F7
 
A.
 

2550

2551

2552
år
451

2553

2554

2555

2556

2557
#
2558

2559

255A
╛255B
_
╜255C
_
nr 255D
nr 255E
 
b.
 
╟255F
_

2560

2561
Yo
401

2562

2563

2564

2565

2566
nr
2567

2568

2569
nr 256A
nr
256B

256C
©
A9
 
C.
 
yu
44E
en
430
b
431
c
446
d
434
e
435
f
444
g
433
x
445
och
438
439 _
till
43A
l
43B
m
43C
n
43D
ca
43E
 
D.
 
n
43F
i
44F
s
440
från
441
t
442

443
f
436
i
432
b
44C
s
44B
s
437
sh
448
e
44D
w
449
h
447
b
44A
 
E.
 
Yu
42E
En
410
B
411
C
426
D
414
E
415
F
424
G
413
X
425
och
418
Y
419
K
41A
L
41B
M
41C
H
41D
Cirka
41E
 
F.
 
P
41F
Jag är
42F
420
kr
C
421
T
422
423 _
F
416
B
412
b
42c
S
42B
W
417
SH
428
E
42D
Shch
429
Ch
427
b
42A

Andra alternativ

Endast icke-matchande tabellrader visas, eftersom allt annat matchar.

Kodning KOI8-U (ryska-ukrainska)

.0 .ett .2 .3 .fyra .5 .6 .7 .åtta .9 .A .B .C .D .E .F
 
A.
 

2550

2551

2552
år
451
$
454

2554
jag
456
457
_

2557
#
2558

2559

255A
╛255B
_
491
_
nr 255D
nr 255E
 
b.
 
╟255F
_

2560

2561
Yo
401
Є
404

2563
Jag
406
407 pund

2566
nr
2567

2568

2569
nr 256A
Ґ
490

256C
©
A9

Kodning KOI8-RU (ryska-vitryska-ukrainska)

.0 .ett .2 .3 .fyra .5 .6 .7 .åtta .9 .A .B .C .D .E .F
 
A.
 

2550

2551

2552
år
451
$
454

2554
jag
456
457
_

2557
#
2558

2559

255A
╛255B
_
491
_
¢
45E
nr 255E
 
b.
 
╟255F
_

2560

2561
Yo
401
Є
404

2563
Jag
406
407 pund

2566
nr
2567

2568

2569
nr 256A
Ґ
490
Î
40E
©
A9

KOI8-C-kodning (Centralasien)

.0 .ett .2 .3 .fyra .5 .6 .7 .åtta .9 .A .B .C .D .E .F
åtta.
- 493
497
_
49B
_
49D
_

n 4A3

- 4AF

- 4B1

h 4B3
ҷ
4B7

nr 4B9

h 4BB

2580
4D9
_
ӣ
4E3
4E9
_
ӯ
4Eо
9. 492
_
496
_
K
49A
49C
_
Ң
4A2

- 4AE
Ұ
4B0

- 4B2

- 4B6

- 4B8
4BA
_

2321
4D8
_
Ӣ
4E2
Ө
4E8
4EE
_
A.  
A0
$
452
-453
_
år
451
$
454
*
455
jag
456
457
_
$
458
459
_
њ
45A
ћ
45B
ќ
45C
491
_
¢
45E
џ
45F
b. nr
2116

402 €
Ѓ
403
Yo
401
Є
404
S
405
Jag
406

407 pund

408 pund

409 pund
Њ40A
_

40 miljarder pund
40C
_
Ґ
490
Î
40E
Џ
40F

Kodning KOI8-O, KOI8-S (slavisk, gammal stavning)

040790}}
.0 .ett .2 .3 .fyra .5 .6 .7 .åtta .9 .A .B .C .D .E .F
203A}} nr 045A
ќ
045C
ћ
045B
џ
045F
Î 040E
©
00A9

Kodning ISO-IR-111, KOI8-E

.0 .ett .2 .3 .fyra .5 .6 .7 .åtta .9 .A .B .C .D .E .F
 
A.
 
 
00A0
0452
$
- 0453
e
0451
є
0454
* 0455
jag
0456
ї
0457
$ 0458
љ
0459
nr 045A
ћ
045B
ќ
045C
­
00 e.Kr
¢
045E
џ
045F
 
b.
 
nr
2116
0402
Ѓ
0403
Yo
0401
Є
0404
S
0405
I
0406
£
0407
£
0408
Љ
0409
Њ
040A
040 miljarder pund
nr 040C
¤
00A4
Î 040E
P 040F

Kodning KOI8-Unified, KOI8-F

KOI8-Unified (KOI8-F)-kodningen föreslogs av Fingertip Software [1] .

.0 .ett .2 .3 .fyra .5 .6 .7 .åtta .9 .A .B .C .D .E .F
 
åtta.
 

2500

2502
┌250C
_

2510

2514

2518

251C

2524

252C

2534

253C

2580

2584

2588
▌258C
_

2590
 
9.
 

2591
'
2018
'
2019
"
201C

201D

2022

2013

2014
©
00A9

2122
 
00A0
»
00BB
®
00AE
«
00AB
00B7
_
¤
00A4
 
A.
 
 
00A0
0452
$
- 0453
e
0451
є
0454
* 0455
jag
0456
ї
0457
$ 0458
љ
0459
nr 045A
ћ
045B
ќ
045C
ґ
0491
¢
045E
џ
045F
 
b.
 
nr
2116
0402
Ѓ
0403
Yo
0401
Є
0404
S
0405
I
0406
£
0407
£
0408
Љ
0409
Њ
040A
040 miljarder pund
nr 040C
Ґ
0490
Î 040E
P 040F

Icke-kyrilliska varianter av KOI-8

I vissa CMEA-länder skapades modifieringar av KOI-8 för nationella varianter av det latinska alfabetet . Grundtanken var densamma - när man "klipper av" den åttonde biten ska texten förbli mer eller mindre tydlig.

Anteckningar

  1. KOI8 Unified // Fingertop Software-webbplats

Länkar