Plan (Unicode)

I Unicode- standarden är ett plan  ett sammanhängande område med 65 536 ( 216 ) kodpunkter. Det finns 17 plan, numrerade från 0 till 16, motsvarande de möjliga värdena 00-10 16 av de två första hexadecimala siffrorna i det sexsiffriga kodpositionsnummerformatet (U+ hh hhhh ). Den sista Unicode-kodpunkten är den sista kodpunkten i plan 16, U+10FFFF. Plan 0 kallas Basic Multilingual  Plane ( BMP ) och innehåller de vanligaste tecknen. De återstående planen (1-16) kallas "extra" [1]. Unicode version 14.0 använder kodpunkter för sju plan, varav två är för privat bruk.

Begränsningen av 17 plan beror på UTF-16- kodningen, där 220 ( 1048576 ) kodpositioner (16 plan) och BMP [2] kunde kodas . UTF -8-kodningen utformades med en mycket större gräns på 2 31 ( 2 147 483 648 ) kodpunkter ( 32 768 plan) och kunde använda 2 21 ( 2 097 152 ) kodpunkter (32 plan) även med en gräns på 4 byte [3] .

Unicode-plan:

Grundläggande flerspråkigt plan

Plane 0 ( Basic Multilingual Plane , BMP ) är reserverad för karaktärerna i de flesta moderna skript och ett stort antal specialtecken .  Större delen av bordet är upptaget av KJK - ideogram och koreanska stavelser .

I Unicode 14.0 är följande block representerade i detta plan:

  • OCR (2440-245F)
  • Inramade bokstäver och siffror (2460-24FF)
  • Pseudografik ( 2500-257F )
  • Blockelement (2580-259F)
  • Geometriska former (25A0—25FF)
  • Diverse tecken (2600-26FF)
  • Dingbats (2700–27BF)
  • Diverse matematiska symboler - A (27C0-27EF)
  • Ytterligare händer - A (27F0-27FF)
  • Punktskrift (2800-28FF)
  • Ytterligare händer - B (2900-297F)
  • Diverse matematiska symboler - B (2980-29FF)
  • Ytterligare matematikoperatörer (2A00-2AFF)
  • Diverse symboler och pilar (2B00—2BFF)
  • Glagolitisk (2C00-2C5F)
  • Latin Extended - C (2C60-2C7F)
  • Koptiskt manus (2C80—2CFF)
  • Tillägg till det georgiska brevet (2D00—2D2F)
  • Forntida libysk skrift (2D30—2D7F)
  • Ethiopian Expanded (2D80-2DDF)
  • Utökad kyrillisk - A (2DE0—2DFF)
  • Ytterligare skiljetecken (2E00-2E7F)
  • Tillägg till nycklar till KKJ (2E80-2EFF)
  • Keys of Kangxi (2F00—2FDF)
  • Ideografiska förklarande tecken (2FF0-2FFF)
  • Symboler och skiljetecken CJK (3000-303F)
  • Hiragana (3040-309F)
  • Katakana (30A0—30FF)
  • Zhuyin fuhao (3100-312F)
  • Kompatibla Hangul -artiklar (3130-318F)
  • Kambun (3190-319F)
  • Utökad zhuyin fuhao (31A0—31BF)
  • Funktioner hos KKJ (31C0—31EF)
  • Katakana Phonetic Extensions (31F0-31FF)
  • Inramade bokstäver och månader KJK (3200-32FF)
  • Kompatibla element CJK (3300-33FF)
  • CJK Unified Ideograms - Extension A (3400-4DBF)
  • Hexagram av Förändringarnas bok (4DC0—4DFF)
  • Enade ideogram av CJK (4E00-9FFF)
  • Syllabary och (A000-A48F)
  • Bokstavsnycklar och (A490—A4CF)
  • Lisu (A4D0—A4FF)
  • Vai (A500—A63F)
  • Förlängd kyrillisk - B (A640—A69F)
  • Bamum (A6A0—A6FF)
  • Tonändringssymboler (A700-A71F)
  • Latin Extended - D (A720-A7FF)
  • Sylhet Nagari (A800—A82F)
  • Vanliga indiska nummerformulär (A830-A83F)
  • Mongoliskt fyrkantsskrift (A840—A87F)
  • Saurashtra (A880—A8DF)
  • Devanagari Extended (A8E0—A8FF)
  • Kaya-li (A900—A92F)
  • Rejang (A930—A95F)
  • Extended Hangul Elements - A (A960—A97F)
  • Javanesiska (A980—A9DF)
  • Burmese Extended - B (A9E0-A9FF)
  • Cham script (AA00-AA5F)
  • Burmese Expanded - A (AA60-AA7F)
  • Thai Viet (AA80—AADF)
  • Manipuri Extensions (AAE0-AAFF)
  • Ethiopian Extended - A (AB00-AB2F)
  • Latin Extended - E (AB30-AB6F)
  • Cherokee-tillägg (AB70—ABBF)
  • Manipuri (ABC0—ABFF)
  • Hanguls kursplan (AC00—D7AF)
  • Extended Hangul Elements - B (D7B0—D7BF)
  • Övre delen av surrogatpar (D800-DB7F)
  • Topp surrogatpar för privat bruk (DB80-DBFF)
  • Nedre delen av surrogatpar (DC00-DFFF)
  • Privat användningsområde (E000-F8FF)
  • Kompatibla CJK-ideogram (F900-FAFF)
  • Alfabetiska presentationsformulär (FB00-FB4F)
  • Arabiska former - A (FB50-FDCF, FDF0-FDFF)
  • Variantväljare (FE00-FE0F)
  • Vertikala former (FE10—FE1F)
  • Kombinerade halvtecken (FE20-FE2F)
  • Kompatibla CJC-formulär (FE30-FE4F)
  • Små variantformer (FE50-FE6F)
  • Arabiska former - B (FE70-FEFF)
  • Halvbredds- och fullbreddsformulär ( FF00 -FFEF)
  • Specialtecken (FFF0-FFFF)

Ytterligare flerspråkigt plan

Plane 1 (Supplementary Multilingual Plane, eng.  Supplementary Multilingual Plane , SMP ) är reserverad i första hand för historisk skrivning, men inkluderar även konventionella symboler som musikaliska och matematiska symboler.

I Unicode 14.0 är följande teckenuppsättningar representerade i detta plan:

  • Linjära B-stavelser (10000-1007F)
  • Linjära B-ideogram (10080-100FF)
  • Egeiska siffror (10100-1013F)
  • Forntida grekiska siffror (10140-1018F)
  • Forntida symboler (10190-101CF)
  • Phaistos-skiva (101D0—101FF)
  • Lyciskt manus (10280-1029F)
  • Carian (102A0—102DF)
  • Koptiska epaktsiffror (102E0-102FF)
  • Old Italic ( 10300-1032F )
  • Gotisk skrift (10330-1034F)
  • Gammal permisk skrift (10350-1037F)
  • Ugaritisk skrift (10380-1039F)
  • Gammal persisk skrift (103A0-103DF)
  • Deseret Letter (10400-1044F)
  • Shaw Alphabet (10450-1047F)
  • Somaliskt manus (10480-104AF)
  • Osage (104B0—104FF)
  • Elbasan manus (10500-1052F)
  • Agvan script (10530-1056F)
  • Vitkut brev (10570-105BF)
  • Linjär A (10600-1077F)
  • Latin Extended - F (10780-107BF)
  • Cypriotisk manus (10800-1083F)
  • Kejserliga arameiska (10840-1085F)
  • Palmyrenbrev ( 10860-1087F )
  • Nabateiskt brev (10880-108AF)
  • Hatran (108E0—108FF)
  • Feniciskt manus (10900-1091F)
  • Lydiansk skrift (10920-1093F)
  • Meroitiska hieroglyfer (10980-1099F)
  • Meroitisk kursiv (109A0-109FF)
  • Kharosthi (10A00—10A5F)
  • Forntida sydarabiska skrift (10A60—10A7F)
  • Forntida nordarabiska skrift (10A80-109FF)
  • Manikéiskt manus (10AC0—10AFF)
  • Avestanskt manus (10B00—10B3F)
  • Parthisk epigrafisk skrift (10B40-10B5F)
  • Pahlavi epigrafiskt manus (10B60-10B7F)
  • Pahlavi Psalter ( 10B80—10BAF )
  • Gammal turkisk runskrift (10C00—10C4F)
  • Ungerska runor (10C00—10C4F)
  • Hanifi (10D00—10D3F)
  • Rumi-nummer (10E60—10E7F)
  • Yezidi-manus (10E80—10EBF)
  • Gammal sogdisk skrift (10F00—10F2F)
  • Sogdisk manus (10F30—10F6F)
  • Gammal uigurisk skrift (10F70—10FAF)
  • Khwarezmian-skript (10FB0—10FBF)
  • Elimaisk bokstav (10FE0—10FFF)
  • Brahmi (11000-1107F)
  • Kaithi (11080-110CF)
  • Sorang sompeng (110D0—110FF)
  • Chakma (11100-1114F)
  • Mahajani (11150-1117F)
  • Charade (11180-111DF)
  • singalesiska arkaiska siffror (111E0-111FF)
  • Hojiki (11200-1124F)
  • Multani (11280-112AF)
  • Khudabadi (112B0—112FF)
  • Grantha (11300-1137F)
  • Neva (11400-1147F)
  • Tirhuta (11480-114DF)
  • Siddhamatrika (11580-115FF)
  • Modi (11600-1165F)
  • Tillägg till den gamla mongoliska skriften (11660-1167F)
  • Takri (11680-116CF)
  • Ahom (11700-1174F)
  • Dogra (11800-1184F)
  • Varang-kshiti (118A0-118FF)
  • Dyk akuru (11900-1195F)
  • Nandinagari (119A0-119FF)
  • Zanabazar Square Script (11A00—11A4F)
  • Soyombo (11A50—11AAF)
  • Utökad kanadensisk syllabary - A (11AB0-11ABF)
  • Po Chin Ho (11AC0—11AFF)
  • Bhaikshukas (11C00-11C6F)
  • Marchen (11C70—11CBF)
  • Gondi Masarama (11D00—11D5F)
  • Gunjal Gondi (11D60—11DAF)
  • Makassar-skript (11EE0—11EFF)
  • Fox Supplement (11FB0—11FBF)
  • Tamilstillägg (11FC0-11FFF)
  • Kilskrift (12000-123FF)
  • Kilskriftssiffror och skiljetecken (12400-1247F)
  • Tidig dynastisk kilskrift (12480-1254F)
  • Cypro-minoiskt manus (12F90-12FFF)
  • Egyptiska hieroglyfer (13000-1342F)
  • Egyptiska hieroglyfformateringskontrolltecken (13430-1343F)
  • Anatoliska hieroglyfer (14400-1467F)
  • Bamum tillägg (16800-16A3F)
  • Mro (16A40—16A6F)
  • Tangsa (16A70—16ACF)
  • Bas (16AD0—16AFF)
  • Pahau (16B00—16B8F)
  • Medefidrin (16E40-16E9F)
  • Miao (16FE0—16FFF)
  • Ideografiska tecken och skiljetecken (16F00-16F9F)
  • Tangut-manus (17000-187FF)
  • Element av Tangut-skrift (18800-18AFF)
  • Litet Khitan-manus (18B00—18CFF)
  • Tillägg till Tangut-manuset (18D00-18D8F)
  • Utökad kana - B (1AFF0—1AFFF)
  • Kana- tillägg (1B000—180FF)
  • Utökad kana - A (1B100—1B12F)
  • Minor kana-förlängning (1B130—1B16F)
  • Nu Shu (Unicode-block) (1B170—1B2FF)
  • Duploier stenografi (1BC00-18C9F)
  • Stenografiformatering av tecken (1BCA0-1BCAF)
  • Znamenny musikalisk notation (1CF00—1CFCF)
  • Bysantinska musiksymboler (1D000—1D0FF)
  • Musiksymboler (1D100—1D1FF)
  • Forntida grekisk notation (1D200—1D24F)
  • Maya-tal (1D2E0—1D2FF)
  • Symboler för "den stora hemlighetens kanon" (1D300-1D35F)
  • Antal räknepinnar (1D360—1D37F)
  • Matematiska bokstäver och siffror (1D400-1D7FF)
  • SignWriting (1D800-1DAAF)
  • Latin Extended - G (1DF00-1DFFF)
  • Glagolitisk tillägg (1E000—1E02F)
  • Nyekeng Puecim Hmong (1E100—1E14F)
  • Toto (1E290—1E2BF)
  • Wancho (1E2C0—1E2FF)
  • Ethiopian Extended - B (1E7E0—1E7FF)
  • Kikakui (1E800—1E8DF)
  • Adam ( 1E900—1E95F )
  • Siyak indiska siffror (1EC70—1ECBF)
  • Osmanska siyak-siffror (1ED00–1ED4F)
  • Arabiska matematiska alfabetsymboler (1EE00-1EEFF)
  • Mahjongtärningar (1F000—1F02F)
  • Dominoben (1F030—1F09F)
  • Spelkort (1F0A0—1F0FF)
  • Tillägg för inramade bokstäver och siffror (1F100-1F1FF)
  • Tillägg för inramade ideografiska tecken (1F200–1F2FF)
  • Diverse symboler och piktogram (1F300-1F5FF)
  • Emoticons (1F600—1F64F)
  • Prydnadstecken (1F650-1F67F)
  • Transport- och sjökortssymboler (1F680-1F6FF)
  • Alkemiska symboler (1F700-1F77F)
  • Utökade geometriska former (1F780-1F7FF)
  • Ytterligare händer - C (1F800-1F8FF)
  • Ytterligare symboler och piktogram (1F900-1F9FF)
  • Schacksymboler (1FA00-1FA6F)
  • Utökade symboler och piktogram - A (1FA70-1FAFF)
  • Symboler för äldre datoranvändning (1FB00-1FBFF)

Ytterligare ideografiskt plan

Plane 2 (Supplementary Ideographic Plane, eng.  Supplementary Ideographic Plane , SIP ) är reserverat för sällan använda hieroglyfer KKJ .

I Unicode 14.0 är följande teckenuppsättningar representerade i detta plan:

Tertiärt ideografiskt plan

Plane 3 ( Tertiary Ideographic Plane , TIP ) innehåller sällan använda kinesiska tecken , det är också tänkt att inkludera historiska former av kinesisk skrift . 

Det tertiära ideografiska planet är uppdelat i följande områden [4] :

I framtiden förväntas det också inkludera Shang- och Zhou-karaktärer ( jinwen , 金文) som finns i rituella inskriptioner på bronskärl och musikinstrument, och uppsättningar av karaktärer från den krigande staternas period [4] .

Specialiserat ytterligare plan

Plane 14 (Specialized additional plane, eng.  Supplementary Special-purpose Plane , SSP ) reserverat för tecken som används för ett speciellt ändamål.

I Unicode 14.0 är följande block representerade i detta plan:

Områden för privat bruk

Vissa Unicode-intervall är reserverade för privat bruk och experiment. Dessa inkluderar:

Se även

Anteckningar

  1. Unicode-konsortiumordlista—Supplementary Planes . Hämtad 30 september 2018. Arkiverad från originalet 24 september 2018.
  2. Se Tabell 3.5 "UTF-16 Bit Distribution" i Unicode Standard https://www.unicode.org/versions/Unicode6.0.0/UnicodeStandard-6.0.pdf Arkiverad 31 mars 2019 på Wayback Machine
  3. Se Tabell 3.6 "UTF-8 Bit Distribution" i Unicode Standard https://www.unicode.org/versions/Unicode6.0.0/UnicodeStandard-6.0.pdf Arkiverad 31 mars 2019 på Wayback Machine
  4. 1 2 3 4 Färdkarta till TIPS  ( PDF) (12 mars 2020). Hämtad 17 mars 2020. Arkiverad från originalet 29 februari 2020.
  5. Förslag att koda Small Seal Script i UCS  (engelska) (PDF) (20 juni 2019). Hämtad 17 mars 2020. Arkiverad från originalet 30 november 2019.
  6. Begäran om kommentar om kodning av Oracle Bone Script  ( PDF) (21 oktober 2015). Hämtad 20 november 2017. Arkiverad från originalet 14 juni 2019.

Länkar