Kombinerad symbol

I digital typografi är kombinerbara tecken  tecken som är utformade för att modifiera andra tecken. De vanligaste kombinerbara tecknen på latin är kombinerbara diakritiska tecken (inklusive kombinerbara accenter ).

Unicode innehåller också många förkomponerade tecken, så i många fall kan både kombinerbara diakritiska tecken och förkomponerade tecken efter användarens eller applikationens val användas. Detta leder till kravet att utföra Unicode-normalisering innan två Unicode-strängar jämförs, och att noggrant utforma kodningskonverterare för att korrekt mappa alla giltiga Unicode-teckenrepresentationer till den äldre kodningen för att undvika dataförlust.

I Unicode är huvudblocket för kombinerbara diakritiska tecken i europeiska språk och det internationella fonetiska alfabetet U+0300…U+036F . Kombinerande diakritiska tecken visas också i många andra Unicode-block. I Unicode placeras diakritiska tecken alltid efter bastecknet (till skillnad från vissa äldre kombinerbara teckenuppsättningar som ANSEL ), vilket gör att flera diakritiska tecken kan läggas till ett enda tecken, även om från och med 2010 är det få applikationer som stöder korrekt visning av sådana kombinationer.

Zalgo text

De kombinerade tecknen används också för att skapa vad som kallas "Zalgo-text"  - text som verkar förvrängd på grund av överdriven användning av diakritiska tecken. Detta gör att texten expanderar vertikalt och överlappar annan text [1] .

Exempel

p̴̢̧̡̧̨̨̨̡̧̢̢̢̢̡̡̢̨̡̧̢̛̛͈͕̩̱̼̲͚̼̻͉̱̤͔̞̤̝̠̗͍̯̰̹̺̺̘͎̝̦̱̤̩͉̼͕̳̹͕͙̘̘̝̘̦̜͇̞͇̰̙̘͙̞̖̝̰̘̰̫̰͉͉͚̥͉̝̣̥̠̳̘͕̖̹̪̘̦̝̗͖̭̺̪̱͓̝̻͈̟̲̳̞̫̥̞̝̹̜̱̺̹͕̟̖̰̫̟͇̭͇̩͖̘̩̺̱̥̯̮̜̰̘̹̼̲̬̣̞̬̥͖͇͎̤̠̠̜̮̱̱̩͙̥͔̯͕̘͍̳͚̝̼͍̱̳̼͓̱̟̫̭͓̬̘̻̟̜̮̹͍̳̙̟̙̝̦͇̣̤̮̘͉̭͙̩͓̯̥̳̳̠̻̭̭͕̝̮̞̠̺͈̮̦̥̺̩͉̞͔̗̬̣̣̬͔̦̩̬̘̟̹͎͎̤̖̻̱͍͍̝͔̠̼͔̦͚̦͍̤̭̝͖͈̥̱͉͉̟̲̫̻̤͓̮̖̜̱̖͍̦̺̦͍̩̱͔͆̈y̎͑̉͋͑͂̾̐̿͑̈ÿ͌̇͗̏̔̓̓̐̇̈̈͌̇͗̏̔̓̓̐̇̈̈͌̇͗̏̔̓̓̐̇̈y͒̅̂̈ẙ̔̄̾͐̃͋͋̐̈̒̂̆͌͐͐͛̊̔̄̾͐̃͋͋̐̈̒̂̆͌͐͐͛r̷̨̧̡̧̨̡̛̛̛̛̛̰̙͔̯͚͔̠͓͙̭̼̱̫̹̪̪̞̤̪͔̻͓̪̥̣̫̪̬̰̘͙͋̆̏̔͛ỳ̀̒̊̆̊̅͌͌̓̊̌̍͊͒͊͆̎̀̅̏̃̆̅͒͒͑͒͗̇̈y̓̒̾̂̀̈y͛̈̌̉͂̉̓̊̓͋̈ỳ̌̍̉̆̈̊͋̀͐͂̀̃̄̒̋͒̈̄̐̈̈y̅̿̌̌̆̆y̅̿̌̌̆̆y͛̒̃̔̋̆̊̐̀̐͊̉͗͑̂͒͐̿̇͊̍͋̏̏͊͛y͛̒̃̔̋̆̊̐̀̐͊̉͗͑̂͒͐̿̇͊̍͋̏̏͊͛ŷ̀͋̉͗̎̽͐̍̀͊ỷ̍̿̉̉̆͒̀̃͛̈y̽̚̚͘̚̚̕͘͘͘̕̚̚͜͜͠͝͠͠͠͝͠͠͠͝͝ѝ̴̡̡̢̛̟͚͉̲̞͓͍͚̱͉͖͕̙̮͎̳̣̰͙̞͍͊̐͐̂̃͛̽̈ẏ̒͌̓̿̑̑̽̀̉y̑̏̚͝͝͝͝ͅṃ̸̡̡̢̛̛̛͉̗̪͚͔̹̜̣̱̜̠͎̥̘͎̟̥̬̘ȳ̂̌͌͑͛̾͒̑̈̋̌̉̾͑͛̒̓͗̈y̿̇y̎͒̌̓̎̊͋͛ẙ̅̃̇͛̄̽̒̋̋̇͂̋̐̈͐̆͑̎̂̔͂͊̈y̔̑̎̾̽̔y̍͛̿̈y̅̿̌̔̈y̅̄͐̈y̔͋̄̎͑̇͊y̿͋̍̈̎̑̿̈y͗̋̎̓̐̆̾̈y̒̿y̾̈̀͛̈ÿ̆̊̏͐̈ỳ̃̍͊̈y̓̽̃͒̀̆̀ R

Områden i Unicode

Unicode innehåller följande block specifikt för kombinerbara diakritiska tecken:

Kanonisk kombinerbarhetsklass

En av egenskaperna hos ett tecken i Unicode är den kanoniska kombinerbarhetsklassen, som endast accepterar numeriska värden [2] .

Menande Full engelsk titel Ryska översättning Beskrivning
0 Not_Reordered Inte bestämd Ej kombinerbara och inramande skyltar; även många tecken för vokaler och konsonanter, även om de är kombinerbara
ett täcka över överläggsskylt Tecken överlagrade på en grundbokstav eller symbol
7 Nukta Nuqta Nukta - ett tecken i skriftsystem härlett från Brahmi
åtta Kana_Voicing Tonade kana-tecken Röstade tecken i kana - dakuten och handakuten
9 Virama Virama Virama är ett tecken i skriftsystem som kommer från Brahmi
10-199 Ccc10—Ccc199 Kanoniska kombinerbarhetsklasser 10-199 Fasta positionsklasser
200 Attached_Below_Left Kontaktskylt längst ner till vänster
202 Bifogad nedan Kontaktskylt nedan
204
208
210
212
214 Bifogat_ovan Kontaktskylt från ovan
216 Bifogad_ovan_höger Kontaktskylt uppe till höger
218 Nedan_Vänster Skylt vänster nere
220 Nedan tecken underifrån
222 Under_Höger Nedre högra tecken
224 Vänster Skylt till vänster
226 Höger Rätt tecken
228 Ovan_vänster Överst till vänster skylt
230 Ovan tecken från ovan
232 Ovan_höger Överst till höger skylt
233 Double_Below dubbeltecken nedan
234 Double_Above dubbelt tecken på toppen
240 Iota_Subscript Interlinjär jota Endast grekiska abonnemang iota

Se även

Anteckningar

  1. Hur fungerar Zalgo-text? . stack overflow . Hämtad 11 april 2019. Arkiverad från originalet 27 maj 2019.
  2. Unicode Standard Annex #44 - Canonical Combining Class Values . Hämtad 6 juni 2019. Arkiverad från originalet 8 juni 2019.

Länkar