I digital typografi är kombinerbara tecken tecken som är utformade för att modifiera andra tecken. De vanligaste kombinerbara tecknen på latin är kombinerbara diakritiska tecken (inklusive kombinerbara accenter ).
Unicode innehåller också många förkomponerade tecken, så i många fall kan både kombinerbara diakritiska tecken och förkomponerade tecken efter användarens eller applikationens val användas. Detta leder till kravet att utföra Unicode-normalisering innan två Unicode-strängar jämförs, och att noggrant utforma kodningskonverterare för att korrekt mappa alla giltiga Unicode-teckenrepresentationer till den äldre kodningen för att undvika dataförlust.
I Unicode är huvudblocket för kombinerbara diakritiska tecken i europeiska språk och det internationella fonetiska alfabetet U+0300…U+036F . Kombinerande diakritiska tecken visas också i många andra Unicode-block. I Unicode placeras diakritiska tecken alltid efter bastecknet (till skillnad från vissa äldre kombinerbara teckenuppsättningar som ANSEL ), vilket gör att flera diakritiska tecken kan läggas till ett enda tecken, även om från och med 2010 är det få applikationer som stöder korrekt visning av sådana kombinationer.
De kombinerade tecknen används också för att skapa vad som kallas "Zalgo-text" - text som verkar förvrängd på grund av överdriven användning av diakritiska tecken. Detta gör att texten expanderar vertikalt och överlappar annan text [1] .
Exempelp̴̢̧̡̧̨̨̨̡̧̢̢̢̢̡̡̢̨̡̧̢̛̛͈͕̩̱̼̲͚̼̻͉̱̤͔̞̤̝̠̗͍̯̰̹̺̺̘͎̝̦̱̤̩͉̼͕̳̹͕͙̘̘̝̘̦̜͇̞͇̰̙̘͙̞̖̝̰̘̰̫̰͉͉͚̥͉̝̣̥̠̳̘͕̖̹̪̘̦̝̗͖̭̺̪̱͓̝̻͈̟̲̳̞̫̥̞̝̹̜̱̺̹͕̟̖̰̫̟͇̭͇̩͖̘̩̺̱̥̯̮̜̰̘̹̼̲̬̣̞̬̥͖͇͎̤̠̠̜̮̱̱̩͙̥͔̯͕̘͍̳͚̝̼͍̱̳̼͓̱̟̫̭͓̬̘̻̟̜̮̹͍̳̙̟̙̝̦͇̣̤̮̘͉̭͙̩͓̯̥̳̳̠̻̭̭͕̝̮̞̠̺͈̮̦̥̺̩͉̞͔̗̬̣̣̬͔̦̩̬̘̟̹͎͎̤̖̻̱͍͍̝͔̠̼͔̦͚̦͍̤̭̝͖͈̥̱͉͉̟̲̫̻̤͓̮̖̜̱̖͍̦̺̦͍̩̱͔͆̈y̎͑̉͋͑͂̾̐̿͑̈ÿ͌̇͗̏̔̓̓̐̇̈̈͌̇͗̏̔̓̓̐̇̈̈͌̇͗̏̔̓̓̐̇̈y͒̅̂̈ẙ̔̄̾͐̃͋͋̐̈̒̂̆͌͐͐͛̊̔̄̾͐̃͋͋̐̈̒̂̆͌͐͐͛r̷̨̧̡̧̨̡̛̛̛̛̛̰̙͔̯͚͔̠͓͙̭̼̱̫̹̪̪̞̤̪͔̻͓̪̥̣̫̪̬̰̘͙͋̆̏̔͛ỳ̀̒̊̆̊̅͌͌̓̊̌̍͊͒͊͆̎̀̅̏̃̆̅͒͒͑͒͗̇̈y̓̒̾̂̀̈y͛̈̌̉͂̉̓̊̓͋̈ỳ̌̍̉̆̈̊͋̀͐͂̀̃̄̒̋͒̈̄̐̈̈y̅̿̌̌̆̆y̅̿̌̌̆̆y͛̒̃̔̋̆̊̐̀̐͊̉͗͑̂͒͐̿̇͊̍͋̏̏͊͛y͛̒̃̔̋̆̊̐̀̐͊̉͗͑̂͒͐̿̇͊̍͋̏̏͊͛ŷ̀͋̉͗̎̽͐̍̀͊ỷ̍̿̉̉̆͒̀̃͛̈y̽̚̚͘̚̚̕͘͘͘̕̚̚͜͜͠͝͠͠͠͝͠͠͠͝͝ѝ̴̡̡̢̛̟͚͉̲̞͓͍͚̱͉͖͕̙̮͎̳̣̰͙̞͍͊̐͐̂̃͛̽̈ẏ̒͌̓̿̑̑̽̀̉y̑̏̚͝͝͝͝ͅṃ̸̡̡̢̛̛̛͉̗̪͚͔̹̜̣̱̜̠͎̥̘͎̟̥̬̘ȳ̂̌͌͑͛̾͒̑̈̋̌̉̾͑͛̒̓͗̈y̿̇y̎͒̌̓̎̊͋͛ẙ̅̃̇͛̄̽̒̋̋̇͂̋̐̈͐̆͑̎̂̔͂͊̈y̔̑̎̾̽̔y̍͛̿̈y̅̿̌̔̈y̅̄͐̈y̔͋̄̎͑̇͊y̿͋̍̈̎̑̿̈y͗̋̎̓̐̆̾̈y̒̿y̾̈̀͛̈ÿ̆̊̏͐̈ỳ̃̍͊̈y̓̽̃͒̀̆̀ R
Unicode innehåller följande block specifikt för kombinerbara diakritiska tecken:
En av egenskaperna hos ett tecken i Unicode är den kanoniska kombinerbarhetsklassen, som endast accepterar numeriska värden [2] .
Menande | Full engelsk titel | Ryska översättning | Beskrivning |
---|---|---|---|
0 | Not_Reordered | Inte bestämd | Ej kombinerbara och inramande skyltar; även många tecken för vokaler och konsonanter, även om de är kombinerbara |
ett | täcka över | överläggsskylt | Tecken överlagrade på en grundbokstav eller symbol |
7 | Nukta | Nuqta | Nukta - ett tecken i skriftsystem härlett från Brahmi |
åtta | Kana_Voicing | Tonade kana-tecken | Röstade tecken i kana - dakuten och handakuten |
9 | Virama | Virama | Virama är ett tecken i skriftsystem som kommer från Brahmi |
10-199 | Ccc10—Ccc199 | Kanoniska kombinerbarhetsklasser 10-199 | Fasta positionsklasser |
200 | Attached_Below_Left | Kontaktskylt längst ner till vänster | |
202 | Bifogad nedan | Kontaktskylt nedan | |
204 | — | ||
208 | — | ||
210 | — | ||
212 | — | ||
214 | Bifogat_ovan | Kontaktskylt från ovan | |
216 | Bifogad_ovan_höger | Kontaktskylt uppe till höger | |
218 | Nedan_Vänster | Skylt vänster nere | |
220 | Nedan | tecken underifrån | |
222 | Under_Höger | Nedre högra tecken | |
224 | Vänster | Skylt till vänster | |
226 | Höger | Rätt tecken | |
228 | Ovan_vänster | Överst till vänster skylt | |
230 | Ovan | tecken från ovan | |
232 | Ovan_höger | Överst till höger skylt | |
233 | Double_Below | dubbeltecken nedan | |
234 | Double_Above | dubbelt tecken på toppen | |
240 | Iota_Subscript | Interlinjär jota | Endast grekiska abonnemang iota |