Vokaliseringar ( arabiska حركات "rörelser", singular حركة haraka ) är ett system av upphöjda och nedsänkta diakritiska tecken som används i arabisk skrift för att indikera korta vokaler och andra funktioner i uttalet av ett ord som inte visas med bokstäver. Ordningen av vokaler i texten kallas tashkil ( arab. تشكيل ). Eftersom bokstäverna i det arabiska alfabetet endast betecknar konsonanter och långa vokaler ( matres lectionis ) [1], då kan den tonlösa texten inte "läsas högt": man kan bara "gissa uttalet" av orden som skrivs i den. Texten med vokaler, tvärtom, innehåller all information som behövs för att läsa den.
Vanligtvis läggs inte vokaliseringar ner i texterna. Undantagen är: Koranen , fall då det är nödvändigt att skilja mellan betydelser, vokaliseringar placeras vanligtvis över en eller flera bokstäver i ett ord, barn- och utbildningsböcker, ordböcker etc. [1] , - liknande arrangemanget av betoningar i texter på ryska . När det är nödvändigt att korrekt förmedla ljudet av ett obekant ord, placeras vokaler ovanför alla konsonanter av detta ord. Som jämförelse: den ryska texten, från vilken beteckningarna på vokaler har tagits bort (till exempel vkpdy svbdni ntsklpdy ), kan inte läsas av en person som inte talar ryska tillräckligt, dock är denna text lätt att läsa av en person som kan alla orden "krypterade" i denna text. Å andra sidan, om uttalet av ett ord är känt, så bestäms dess inspelning unikt av detta uttal - detta är skillnaden mellan konsonantskrivning och ideografisk , där inspelningen och uttalet av ordet inte har något samband.
Dessutom är texten med saknade vokaler i de semitiska språken , där vokalerna bär huvudsakligen grammatisk och ordbildningsinformation , lättare att läsa av en infödd talare än i fallet när vokalerna saknas i indoeuropeiska ord. språk , där de är samma lika element som konsonanterna rot . Ur innehållssynpunkt är korrespondensen för den arabiska texten utan vokaler på europeiska språk den förkortade notationen av ord utan ändelser eller till och med några suffix (gratis flerspråkig uppslagsverk, där var och en kan ändras eller läggas till i valfri stat. ) . Naturligtvis gäller detta inte icke-semitiska språk som använder den arabiska skriften (som indoeuropeisk persisk eller turkisk uigurisk ); för dem kan vokaler i vissa fall spela en större roll.
Tecken | |||
---|---|---|---|
fatha | kasra | damma | sukun |
◌َ | ◌ِ | ◌ُ | ◌ْ |
När en konsonant följs av en vokal (kort eller lång), placeras ett vokalmärke ovanför konsonanten som motsvarar nästa vokal. Om denna vokal är lång, så indikeras den dessutom med en bokstav (den så kallade harf mad - bokstaven för förlängning) som följer efter konsonanten [2] .
Om det inte finns någon vokal efter en konsonant (före nästa konsonant eller i slutet av ett ord), så placeras vokalen sukun ovanför den.
Med fullständig röstning av texten (till exempel i Koranen ) måste varje bokstav som betecknar en konsonant ha ett av de fyra tecknen nedan. Dessa tecken kan inte placeras bredvid bokstäver som anger vokalförlängning.
Fatah Stapeln ovanför bokstaven ( ◌َ , fatḥa, arabiska فتحة "öppning") anger ljudet a . Den motsvarande förlängningsbokstaven är ا (alif). Kasra ( kasra ) Stapeln under bokstaven ( ◌ِ , kasra, arabiska كسرة "brytande") anger ljudet och . Motsvarande förlängningsbokstav är ﻱ (ya'). Damma Kroken ovanför bokstaven ( ◌ُ , ḍamma, arabiska ضمة "anslutning") anger ljudet y . Motsvarande förlängningsbokstav är و (wow). Sukun Cirkeln ovanför bokstaven ( ◌ْ , sukun, arabiska سكون "tystnad") indikerar frånvaron av ett vokalljud.Fördubbling i slutet av ordet en av de tre vokalerna som betecknar vokaler (tanvin, arabiska تنوين ), bildar en kasusändelse ('i'r̄b, arabiska إﻋﺮﺍﺏ ), som anger det obestämda tillståndet för detta ord och uttalas en , i eller un , beroende på dubbelvokal. Tanvin som i'rab finns också i vissa egennamn , till exempel مُحَمَّدٌ muhammadun , " Muhammed ". På klassisk arabiska uttalas inte kasusändelsen i slutet av en fras eller före en paus; i vardagligt tal uttalas det inte alls [2] .
Tanvin-fatha kan bara stå ovanför bokstäverna alif, hamza och ta-marbuta. I andra fall skrivs den outtalbara bokstaven alif i slutet av ordet, och tanvin-fatha skrivs ovanför den.
Shadda är ett W-format tecken ovanför bokstaven (shadda, arabiska شدة "förstärkning") och betecknar fördubblingen av bokstaven [3] . Det används i två fall: för att beteckna en dubbelkonsonant (det vill säga en kombination av formen X-sukun-X), eller i kombinationer av en lång vokal och en konsonant, betecknad med samma bokstav (det finns två sådana kombinationer : ӣй och ӯв). Vokalisering av en dubblerad konsonant med fatha eller damma avbildas ovanför shadda, kasra - under bokstaven eller under shadda [1] .
En vågig linje ovanför bokstaven alif (madda, arabiska مدة "förlängning") betecknar en kombination av hamza-alif eller hamza-hamza, när det enligt reglerna för att skriva hamza skrivs med ett alif-stativ [4] . Reglerna för arabisk stavning förbjuder följande i ett ord av två bokstäver i alif i rad, därför, i de fall där en sådan kombination av bokstäver förekommer, ersätts den med bokstaven alif-madda. Av samma anledning, i kombinationen alif-madda (alif-hamza-alif), skrivs inte alif-madda - istället skrivs hamza utan stativ.
Madda är obligatorisk att använda även i tonlösa texter - som hamza, som den ersätter. Därför kan man argumentera om det syftar på vokaler, eller, som hamza, är ett självständigt tecken på den arabiska skriften.
Ett tecken som liknar bokstaven sad (ٱ) ovanför alif i början av ett ord (wasla, arabiska وصلة "union") indikerar att detta alif inte uttalas om det föregående ordet slutade på en vokal [5] . Bokstaven alif-wasla förekommer i ett litet antal ord, liksom i prefixet al- . Eftersom alif-wasla i den oreducerade positionen betecknar hamza, är ett annat namn för denna bokstav hamzatu-l-wasl ( arabiska همزة الوصل , "föreningens hamza").
Tecknet i form av bokstaven alif ovanför texten ( Arab. ألف خنجرية ' alif x̮anjariya , "dolk alif") betecknar ett långt ljud а̄ i ord där den vanliga alifen inte skrivs enligt ortografisk tradition. Detta inkluderar mestadels egennamn (inklusive ordet Allah ), såväl som några demonstrativa pronomen (till exempel هٰذَا h̄ẕā̄ "detta"). I full vokalisering är det upphöjda alif också placerat ovanför bokstaven alif-maksura för att visa att det läses som ett långt а̄ [1] .
Det upphöjda alif är ett mycket sällsynt tecken, och förutom i Koranen används det vanligtvis inte. Dessutom, i Koranen, finns det upphöjda alif ibland även i de ord där, enligt reglerna, det vanliga alif är skrivet. Till exempel i frasen arabiska. بسم الله الرحمن الرحيم (" bismillahi r-rahmani r-rahim "), med vilken varje sura börjar, skrivs det upphöjda alif ( رَحْمٰن ) i ordet "rahman" - trots att detta ord i alla andra fall är skriven med den vanliga alifen ( رَحْمَان ) [6] .
Även om hamza ( arab. همزة "klämma") inte är en vokal och betecknar en konsonant ( glottal stop ), skrivs den vanligtvis som en diakritisk och introducerades samtidigt som vokalerna. Således intar den en mellanposition mellan bokstäverna i det arabiska alfabetet och hjälptecken i den arabiska skriften. I synnerhet är stavningen av hamza obligatorisk även i en tonlös text.
Sättet att skriva hamza ges av reglerna för arabisk stavning [1] :
Det finns ett antal undantag från dessa regler, där det traditionella sättet att skriva hamza bevaras: innan det hade ett eget tecken, avbildades den som en alif-bokstav, eller inte skriven alls.
Alla ord på klassisk arabiska börjar med konsonanter; därför är det inga problem med att skriva vokaler utan baskonsonant. Eftersom den initiala hamzaen inte uttalas i vardagligt tal, börjar sådana ord i translitteration med vokaler. Faktum är att vissa av dessa ord (till exempel namnen Ahmad och Osama ) börjar med hamza, och vokalen som motsvarar ordets initiala vokal placeras ovanför denna hamza. Dessutom börjar ett antal ord som börjar i translitteration med vokaler (till exempel namnen Isa och Ali ) faktiskt med ett ljud som betecknas med bokstaven `ayn och har inga analoger på europeiska språk. Även om detta ljud uttalas i de flesta arabiska dialekter, finns det inget etablerat sätt att translitterera för det, och därför utelämnas det ofta i translitteration.
Ursprungligen använde arabisk skrift inte punkter över och under bokstäver; alfabetet bestod av 15 bokstäver, som går tillbaka till det feniciska alfabetet , och de flesta av bokstäverna betecknade flera ljud samtidigt. Enligt legenden uppfanns den första tashkilen, som består i att lägga till flerfärgade punkter till homografiska bokstäver för att indikera deras ljud, av Kufi Abu al-Aswad ad-Du'ali i riktning av kalifen Ali , när han såg en kopia av Koranen med fel och krävde att kodifiera reglerna för det arabiska språket. Att lägga till prickar till de grundläggande formerna av bokstäver för att skilja dem åt med ljud (naḳṭ, arabiska نقط ) är tydligen inte ad-Du'alis egen uppfinning, eftersom en papyrus från 643 är känd , där sådana punkter redan används [7] .
Separata tecken för vokaler dök upp senare, under andra hälften av 700-talet , när Al-Hajjaj ibn Yusuf ( 661 - 714 ), på ledning av härskaren över Irak, som översatte kontorsarbete i Irak från Pahlavi till arabiska, system skapades för att beteckna korta vokaler med små röda prickar. För att beteckna hamza, som i ad-Du'ali-systemet, användes gula prickar. Skaparna av det nya systemet var två elever av ad-Du'ali: Nasr ibn `Asym (d. 707 ) och Yahya ibn Ya`mur (d. 746 ). Besväret med deras system var behovet av att använda tre färger för att skriva vokaltexten, så att vokalpunkterna kunde särskiljas från nakta - bokstävernas prickelement.
Vokalsystemet i sin moderna form skapades år 786 av omanien Khalil ibn Ahmad al - Farahidi ( 718-791 ), sammanställaren av den första ordboken för det arabiska språket. Han uppfann också det moderna tecknet för hamza. I början av 1000-talet hade användningen av al-Farahidi-systemet blivit allmänt accepterad [8] .
I Unicode representeras vokaler både som kombinerbara diakritiska tecken och som monolitiska tecken. Monolitiska symboler är indelade i tre klasser: en kombination av bokstäver och vokaler; en kombination av mellanslag och vokal; kombination av kashida (horisontell linje) och vokal [9] .
Tabellerna visar också överensstämmelsen mellan Unicode-koder och positionerna för de vanligaste arabiska teckentabellerna : ASMO -708, DOS -720, DOS -864, ISO 8859 -6 (alias ECMA -114 och CP-28596), Windows -1256 och Macintosh arabiska (it eller CP-10004). Positionerna för grundläggande arabiska bokstäver och vokaler på ASMO-, ISO/ECMA- och Macintosh-sidorna är desamma, så de kallas tillsammans för ISO i tabellen. Resten av de namngivna teckentabellerna betecknas i tabellen som DOS-720, DOS-864 respektive Windows.
ASMO- och DOS-kodtabeller hänvisar till OEM - kodningar som innehåller pseudografiska tecken. Samtidigt är DOS-864 unik genom att den inte kodar bokstäver, utan grafiska element av arabisk skrift - positionella former av bokstäver och deras individuella delar. Det fanns inte tillräckligt med utrymme på den här kodsidan för att koda de flesta vokaliseringarna. Representationen av text i DOS-864 liknar dess skrivning på en arabisk skrivmaskin , som har separata nycklar för alla delar av arabisk skrift och inte tillåter röstning av maskinskriven text.
ModifieringsteckenKulan (•) används här som bassymbol .
Tecken | Koden | namn | Kodtabellmappningar | |
---|---|---|---|---|
ً• | tanvin fatha | U+064B | arabiska | EB (ISO), F1 (DOS-720), F0 (Windows) |
ٌ• | Tanvin-damma | U+064C | Arabiska Dammatan | EC (ISO), F2 (DOS-720), F1 (Windows) |
ٍ• | Tanvin-kasra | U+064D | Arabiska Kasratan | ED (ISO), F3 (DOS-720), F2 (Windows) |
َ• | Fatah | U+064E | Arabiska Fatha | EE (ISO), F4 (DOS-720), F3 (Windows) |
ُ• | Damma | U+064F | Arabiska Damma | EF (ISO), F5 (DOS-720, Windows) |
ِ• | kasra | U+0650 | Arabiska Kasra | F0 (ISO), F6 (DOS-720, Windows) |
ّ• | Shadda | U+0651 | Arabiska Shadda | F1 (ISO, DOS-864), 91 (DOS-720), F8 (Windows) |
ْ• | Sukun | U+0652 | Arabiska Sukun | F2 (ISO), 92 (DOS-720), FA (Windows) |
ٓ• | Madda | U+0653 | Arabiska Maddah ovan | |
ٰ• | Upphöjd alif | U+0670 | Arabisk bokstav upphöjd Alef |
Kombination | Koden | namn | Kommentar, sönderdelning, korrespondenser | |
---|---|---|---|---|
آ | Alif Madda | U+0622 | Arabiska Bokstaven Alef Med Madda Ovan | = U+0627 U+0653; = C2 (ISO, Windows), 99 (DOS-720) |
ٱ | Alif Vasla | U+0671 | Arabiska bokstaven Alef Wasla | |
ﭐ | Alif Vasla | U+FB50 | Arabiska bokstaven Alef Wasla isolerade form | initial stil, ≈U+0671 |
ﭑ | Alif Vasla | U+FB51 | Arabiska bokstaven Alef Wasla slutlig form | medialt, ≈U+0671 |
ﱛ | Zal, upphöjd alif | U+FC5B | Arabisk Ligature Thal Med Upphöjd Alef Isolerad Form | isolerad/initial stil, ≈U+0630 U+0670 |
ﱜ | Ra, upphöjd alif | U+FC5C | Arabisk Ligature Reh Med Upphöjd Alef Isolerad Form | isolerad/initial stil, ≈U+0631 U+0670 |
ﱝ | Alif-maksura, upphöjd alif | U+FC5D | Arabisk ligatur Alef Maksura med upphöjd Alef isolerad form | isolerad stil, ≈U+0649 U+0670 |
ﲐ | Alif-maksura, upphöjd alif | U+FC90 | Arabisk ligatur Alef Maksura Med Superscript Alef Final Form | slutlig stil, ≈U+0649 U+0670 |
ﳙ | Ha, upphöjd alif | U+FCD9 | Arabisk ligatur Heh med upphöjd Alef Initial Form | initial stil, ≈U+0647 U+0670 |
ﴼ | Alif, tanvin fatha | U+FD3C | Arabisk Ligature Alef Med Fathatan Slutlig Form | slutlig stil, ≈U+0627 U+064B |
ﴽ | Alif, tanvin fatha | U+FD3D | Arabisk Ligature Alef Med Fathatan Isolerad Form | isolerad stil, ≈U+0627 U+064B |
ﺁ | Alif Madda | U+FE81 | Arabiska Bokstaven Alef Med Madda Ovanför Isolerad Form | isolerad/initial stil, ≈U+0622; =C2 (DOS-864) |
ﺂ | Alif Madda | U+FE82 | Arabiska Bokstaven Alef Med Madda Ovan Slutlig Form | mitt/slut, ≈U+0622; =A2 (DOS-864) |
ﻵ | Lam, alif-madda | U+FEF5 | Arabisk Ligature Lam Med Alef Med Madda ovanför isolerad form | isolerad/initial stil, ≈U+0644 U+0622; =F9 (DOS-864) |
ﻶ | Lam, alif-madda | U+FEF6 | Arabisk Ligature Lam Med Alef Med Madda Ovan Final Form | mitt/slut, ≈U+0644 U+0622; =FA (DOS-864) |
Tecken | Koden | namn | Sönderfall | |
---|---|---|---|---|
ﱞ | Shadda, tanvin-damma | U+FC5E | Arabisk Ligature Shadda Med Dammatan Isolerad Form | = U+0020 U+064C U+0651 |
ﱟ | Shadda, tanvin-kasra | U+FC5F | Arabisk Ligature Shadda Med Kasratan Isolerad Form | = U+0020 U+064D U+0651 |
ﱠ | Shadda, fatha | U+FC60 | Arabisk Ligature Shadda Med Fatha Isolerad Form | = U+0020 U+064E U+0651 |
ﱡ | Shadda, damma | U+FC61 | Arabisk Ligature Shadda Med Damma Isolerad Form | = U+0020 U+064F U+0651 |
ﱢ | Shadda, kasra | U+FC62 | Arabisk Ligature Shadda Med Kasra Isolerad Form | = U+0020 U+0650 U+0651 |
ﱣ | Shadda, upphöjd alif | U+FC63 | Arabisk ligatur Shadda med upphöjd Alef isolerad form | = U+0020 U+0651 U+0670 |
ﹰ | tanvin fatha | U+FE70 | Arabiska Fahatan isolerad form | = U+0020 U+064B |
ﹲ | Tanvin-damma | U+FE72 | Arabiska Dammatan isolerade form | = U+0020 U+064C |
ﹶ | Fatah | U+FE76 | Arabiska Fatha isolerad form | = U+0020 U+064E |
ﹴ | Tanvin-kasra | U+FE74 | Arabiska Kasratan isolerade form | = U+0020 U+064D |
ﹸ | Damma | U+FE78 | Arabisk Damma isolerad form | = U+0020 U+064F |
ﹺ | kasra | U+FE7A | Arabiska Kasra isolerade form | = U+0020 U+0650 |
ﹼ | Shadda | U+FE7C | Arabiska Shadda isolerad form | = U+0020 U+0651 |
ﹾ | Sukun | U+FE7E | Arabisk Sukun isolerad form | = U+0020 U+0652 |
Tecken | Koden | namn | Sönderfall | |
---|---|---|---|---|
ﳲ | Shadda, fatha | U+FCF2 | Arabisk Ligature Shadda Med Fatha Medial Form | = U+0640 U+064E U+0651 |
ﳳ | Shadda, damma | U+FCF3 | Arabisk Ligature Shadda Med Damma Medial Form | = U+0640 U+064F U+0651 |
ﳴ | Shadda, kasra | U+FCF4 | Arabisk Ligature Shadda Med Kasra Medial Form | = U+0640 U+0650 U+0651 |
ﹱ | tanvin fatha | U+FE71 | Arabisk Tatweel Med Fahatan Ovan | = U+0640 U+064B |
ﹷ | Fatah | U+FE77 | Arabisk Fatha Medial Form | = U+0640 U+064E |
ﹹ | Damma | U+FE79 | Arabisk Damma Medial Form | = U+0640 U+064F |
ﹻ | kasra | U+FE7B | Arabisk Kasra Medial Form | = U+0640 U+0650 |
ﹽ | Shadda | U+FE7D | Arabisk Shadda Medial Form | = U+0640 U+0651; =F0 (DOS-864) |
ﹿ | Sukun | U+FE7F | Arabisk Sukun Medial Form | = U+0640 U+0652 |
Inom parentes står nycklarna för den latinska standardlayouten ( QWERTY ) som motsvarar de anropade nycklarna.
Tecken som inte kan matas in direkt från tangentbordet kan matas in med hjälp av deras koder ovan. I Windows används Alt+[hexadecimal teckenkod i Unicode] för detta, till exempel Alt+653 för madda, Alt+670 för upphöjd alif, Alt+671 för alif-wasla. Siffror kan skrivas på det primära eller sekundära tangentbordet, oavsett NumLock-tillståndet. För andra sätt att ange tecken med sina koder, se Unicode- artikeln .
Arabiska språket • العربية | |||||||
---|---|---|---|---|---|---|---|
Recensioner | |||||||
Skrivande | |||||||
Arabiska alfabetet |
| ||||||
Brev | |||||||
periodisering | |||||||
Olika sorter |
| ||||||
Akademisk | |||||||
Kalligrafi |
| ||||||
Lingvistik |