Plan (Unicode)
I Unicode- standarden är ett plan ett sammanhängande område med 65 536 ( 216 ) kodpunkter. Det finns 17 plan, numrerade från 0 till 16, motsvarande de möjliga värdena 00-10 16 av de två första hexadecimala siffrorna i det sexsiffriga kodpositionsnummerformatet (U+ hh hhhh ). Den sista Unicode-kodpunkten är den sista kodpunkten i plan 16, U+10FFFF. Plan 0 kallas Basic Multilingual Plane ( BMP ) och innehåller de vanligaste tecknen. De återstående planen (1-16) kallas "extra" [1]. Unicode version 14.0 använder kodpunkter för sju plan, varav två är för privat bruk.
Begränsningen av 17 plan beror på UTF-16- kodningen, där 220 ( 1048576 ) kodpositioner (16 plan) och BMP [2] kunde kodas . UTF -8-kodningen utformades med en mycket större gräns på 2 31 ( 2 147 483 648 ) kodpunkter ( 32 768 plan) och kunde använda 2 21 ( 2 097 152 ) kodpunkter (32 plan) även med en gräns på 4 byte [3] .
Unicode-plan:
- Plan 0 (0000-FFFF): Basic Multilingual Plane ( BMP )
- Plan 1 (10000-1FFFF): Kompletterande flerspråkigt plan ( SMP )
- Plan 2 ( 20000-2FFFF): Kompletterande ideologiskt plan (SIP )
- Plan 3 ( 30000-3FFFF): Tertiärt ideologiskt plan (TIPS )
- Plan 4-13 (40000-DFFFF) används inte
- Plan 14 (E0000—EFFFF): Kompletterande specialplan ( SSP )
- Plan 15 ( F0000-FFFFF) Kompletterande privat användningsområde-A, SPUA - A
- Plan 16 (100000-10FFFF) Kompletterande privat användningsområde-B ( SPUA -B )
Grundläggande flerspråkigt plan
Plane 0 ( Basic Multilingual Plane , BMP ) är reserverad för karaktärerna i de flesta moderna skript och ett stort antal specialtecken . Större delen av bordet är upptaget av KJK - ideogram och koreanska stavelser .
I Unicode 14.0 är följande block representerade i detta plan:
|
- OCR (2440-245F)
- Inramade bokstäver och siffror (2460-24FF)
- Pseudografik ( 2500-257F )
- Blockelement (2580-259F)
- Geometriska former (25A0—25FF)
- Diverse tecken (2600-26FF)
- Dingbats (2700–27BF)
- Diverse matematiska symboler - A (27C0-27EF)
- Ytterligare händer - A (27F0-27FF)
- Punktskrift (2800-28FF)
- Ytterligare händer - B (2900-297F)
- Diverse matematiska symboler - B (2980-29FF)
- Ytterligare matematikoperatörer (2A00-2AFF)
- Diverse symboler och pilar (2B00—2BFF)
- Glagolitisk (2C00-2C5F)
- Latin Extended - C (2C60-2C7F)
- Koptiskt manus (2C80—2CFF)
- Tillägg till det georgiska brevet (2D00—2D2F)
- Forntida libysk skrift (2D30—2D7F)
- Ethiopian Expanded (2D80-2DDF)
- Utökad kyrillisk - A (2DE0—2DFF)
- Ytterligare skiljetecken (2E00-2E7F)
- Tillägg till nycklar till KKJ (2E80-2EFF)
- Keys of Kangxi (2F00—2FDF)
- Ideografiska förklarande tecken (2FF0-2FFF)
- Symboler och skiljetecken CJK (3000-303F)
- Hiragana (3040-309F)
- Katakana (30A0—30FF)
- Zhuyin fuhao (3100-312F)
- Kompatibla Hangul -artiklar (3130-318F)
- Kambun (3190-319F)
- Utökad zhuyin fuhao (31A0—31BF)
- Funktioner hos KKJ (31C0—31EF)
- Katakana Phonetic Extensions (31F0-31FF)
- Inramade bokstäver och månader KJK (3200-32FF)
- Kompatibla element CJK (3300-33FF)
- CJK Unified Ideograms - Extension A (3400-4DBF)
- Hexagram av Förändringarnas bok (4DC0—4DFF)
- Enade ideogram av CJK (4E00-9FFF)
- Syllabary och (A000-A48F)
- Bokstavsnycklar och (A490—A4CF)
- Lisu (A4D0—A4FF)
- Vai (A500—A63F)
- Förlängd kyrillisk - B (A640—A69F)
- Bamum (A6A0—A6FF)
- Tonändringssymboler (A700-A71F)
- Latin Extended - D (A720-A7FF)
- Sylhet Nagari (A800—A82F)
- Vanliga indiska nummerformulär (A830-A83F)
- Mongoliskt fyrkantsskrift (A840—A87F)
- Saurashtra (A880—A8DF)
- Devanagari Extended (A8E0—A8FF)
- Kaya-li (A900—A92F)
- Rejang (A930—A95F)
- Extended Hangul Elements - A (A960—A97F)
- Javanesiska (A980—A9DF)
- Burmese Extended - B (A9E0-A9FF)
- Cham script (AA00-AA5F)
- Burmese Expanded - A (AA60-AA7F)
- Thai Viet (AA80—AADF)
- Manipuri Extensions (AAE0-AAFF)
- Ethiopian Extended - A (AB00-AB2F)
- Latin Extended - E (AB30-AB6F)
- Cherokee-tillägg (AB70—ABBF)
- Manipuri (ABC0—ABFF)
- Hanguls kursplan (AC00—D7AF)
- Extended Hangul Elements - B (D7B0—D7BF)
- Övre delen av surrogatpar (D800-DB7F)
- Topp surrogatpar för privat bruk (DB80-DBFF)
- Nedre delen av surrogatpar (DC00-DFFF)
- Privat användningsområde (E000-F8FF)
- Kompatibla CJK-ideogram (F900-FAFF)
- Alfabetiska presentationsformulär (FB00-FB4F)
- Arabiska former - A (FB50-FDCF, FDF0-FDFF)
- Variantväljare (FE00-FE0F)
- Vertikala former (FE10—FE1F)
- Kombinerade halvtecken (FE20-FE2F)
- Kompatibla CJC-formulär (FE30-FE4F)
- Små variantformer (FE50-FE6F)
- Arabiska former - B (FE70-FEFF)
- Halvbredds- och fullbreddsformulär ( FF00 -FFEF)
- Specialtecken (FFF0-FFFF)
|
Ytterligare flerspråkigt plan
Plane 1 (Supplementary Multilingual Plane, eng. Supplementary Multilingual Plane , SMP ) är reserverad i första hand för historisk skrivning, men inkluderar även konventionella symboler som musikaliska och matematiska symboler.
I Unicode 14.0 är följande teckenuppsättningar representerade i detta plan:
Ytterligare ideografiskt plan
Plane 2 (Supplementary Ideographic Plane, eng. Supplementary Ideographic Plane , SIP ) är reserverat för sällan använda hieroglyfer KKJ .
I Unicode 14.0 är följande teckenuppsättningar representerade i detta plan:
Tertiärt ideografiskt plan
Plane 3 ( Tertiary Ideographic Plane , TIP ) innehåller sällan använda kinesiska tecken , det är också tänkt att inkludera historiska former av kinesisk skrift
.
Det tertiära ideografiska planet är uppdelat i följande områden [4] :
- Unified CJK ideograms - extension G (30000-3134F) - ytterligare sällan använda kinesiska ideogram;
- Zhuanshu (31400-342FF) - hieroglyfer i stil med "liten säl" (xiaozhuan, 小篆) och "stor säl" (dazhuan, 大篆) [5] [4] ;
- Jiaguwen (34400-35BFF) är de äldsta kinesiska tecknen från Shang-eran ( jiaguwen , 甲骨文), som finns i spådomsinskrifter på snäckor, skallar och djurben [6] [4]
I framtiden förväntas det också inkludera Shang- och Zhou-karaktärer ( jinwen , 金文) som finns i rituella inskriptioner på bronskärl och musikinstrument, och uppsättningar av karaktärer från den krigande staternas period [4] .
Specialiserat ytterligare plan
Plane 14 (Specialized additional plane, eng. Supplementary Special-purpose Plane , SSP ) reserverat för tecken som används för ett speciellt ändamål.
I Unicode 14.0 är följande block representerade i detta plan:
- Taggar (E0000—E007F)
- Variant Selectors Supplement (E0100—E01EF)
Områden för privat bruk
Vissa Unicode-intervall är reserverade för privat bruk och experiment. Dessa inkluderar:
- Privat område i det grundläggande flerspråkiga planet (E000-F8FF)
- Ytterligare plan 15 (F0000-U+FFFFF) och 16 (100000-10FFFF)
Se även
Anteckningar
- ↑ Unicode-konsortiumordlista—Supplementary Planes . Hämtad 30 september 2018. Arkiverad från originalet 24 september 2018. (obestämd)
- ↑ Se Tabell 3.5 "UTF-16 Bit Distribution" i Unicode Standard https://www.unicode.org/versions/Unicode6.0.0/UnicodeStandard-6.0.pdf Arkiverad 31 mars 2019 på Wayback Machine
- ↑ Se Tabell 3.6 "UTF-8 Bit Distribution" i Unicode Standard https://www.unicode.org/versions/Unicode6.0.0/UnicodeStandard-6.0.pdf Arkiverad 31 mars 2019 på Wayback Machine
- ↑ 1 2 3 4 Färdkarta till TIPS ( PDF) (12 mars 2020). Hämtad 17 mars 2020. Arkiverad från originalet 29 februari 2020.
- ↑ Förslag att koda Small Seal Script i UCS (engelska) (PDF) (20 juni 2019). Hämtad 17 mars 2020. Arkiverad från originalet 30 november 2019.
- ↑ Begäran om kommentar om kodning av Oracle Bone Script ( PDF) (21 oktober 2015). Hämtad 20 november 2017. Arkiverad från originalet 14 juni 2019.
Länkar
Unicode- block _ _ |
---|
Grundläggande flerspråkigt plan (plan 0, BMP) [U+0000…U+FFFF] |
---|
|
|
|
Ytterligare ideografiskt plan (plan 2, SIP) [U+20000…U+2FFFF] |
---|
|
|
Tertiärt ideografiskt plan (plan 3, TIPS) [U+30000…U+3FFFF] |
---|
- CJK Unified Ideograms - Extension G
|
|
Plan 4-13 [U+40000…U+DFFFF] |
---|
Inte inblandad |
|
Specialiserat tilläggsplan (Plane 14, SSP) [U+E0000…U+EFFFF] |
---|
- Taggar
- Kompletterande variantväljare
|
|
Områden för privat bruk (plan 15 och 16, PUA) [U+F0000…U+10FFFF] |
---|
|
|