Leipzig-glansreglerna är en uppsättning glosningsregler (pomorfemisk notation ) som föreslås för enhetlig användning när språkexempel presenteras i språkliga verk . Innehåller både de faktiska reglerna för utformningen av interlinjära gloss och en lista över rekommenderade förkortningar (grammatiska märken, "etiketter") som används för att ange grammatiska kategorier .
Leipzig-glansreglerna utvecklades gemensamt av institutionen för lingvistik vid Max Planck-institutet för evolutionär antropologi och institutionen för lingvistik vid universitetet i Leipzig i mitten av 2000-talet. De skapades mot bakgrund av frånvaron av något enhetligt system inom den vetenskapliga lingvistiska gemenskapen, och är ett verktyg som en lingvist kan tillgripa när de står inför behovet av att glossa en text. Eftersom vissa privata överenskommelser redan vid det här laget hade bildats inom lingvistik om vissa aspekter av glossning, är huvuduppgiften för dessa regler att tydligt ange de mest använda konventionerna.
Senare, i början av 2010-talet, föreslog Martin Haspelmat att använda en enda designmall för språkliga verk för att övervinna den skillnad i designkrav som finns i olika tidskrifter och förlag [1] . Reglerna han utvecklade ( eng. The Generic Style Rules for Linguistics ) accepterades i synnerhet i det språkliga förlaget Language Science Press , som ansluter sig till ideologin om öppen tillgång [2] .
Interlinjär morfemisk glossning används för att förmedla information om betydelsen och grammatiska egenskaper hos enskilda ord eller deras delar. Beroende på vilken uppgift författaren står inför som använder sig av glans, och på den förväntade beredskapsnivån hos läsaren, kan olika grader av glansdetaljering användas. Dessa regler tillåter varierande grad av flexibilitet i användningen och erbjuder i vissa fall alternativ för samma uppgift. Den huvudsakliga användningen av reglerna, som föreslås av författarna till projektet, är förklaringen av exempel som ges i vetenskapliga publikationer.
Eftersom reglerna endast erbjuder verktyg för att förmedla information om morfem, kanske de inte räcker till vid markering av textkorpus (till exempel när det är nödvändigt att markera element i texten som går utöver morfologinivån, såsom ord eller fraser). .
Det bör också noteras att det ofta kan finnas mer än en metod för analys av morfologiska strukturer i ett språk. I detta avseende föreslår reglerna inte att följa ett eller annat tillvägagångssätt, utan erbjuder endast möjliga alternativ för att utse de beskrivna elementen. Dessutom är en fullfjädrad morfologisk analys sällan begränsad till enbart glossning, så glöm inte att dess användning inte kan ersätta analysen av morfologisk struktur, utan endast tjänar till att förse läsaren med betydande information om textens struktur, förutom dess litterära översättning.
När man citerar glossade texter från externa källor bör man ha i åtanke att gloser egentligen inte är språkdata, utan är en metod för att analysera språkdata. Följaktligen kan författaren, när han citerar ett exempel från tidigare publicerade verk, ändra sättet att ordna i enlighet med sin egen terminologi, sin egen stil eller när han använder andra analysmetoder.
Presentationsstandarden i moderna språkliga verk är att ge ett språkexempel i tre "lager" (rader):
Beroende på författarens uppgift kan det finnas fler lager (till exempel stavning och transkription separat eller två typer av transkription; idiomatisk och bokstavlig översättning separat, etc.). Glansskiktet kanske inte ges för allmänt kända språk (till exempel de västeuropeiska huvudspråken, slaviska språk i slaviska verk, etc.).
Metaspråket för att översätta lexikaliska betydelser (i glossraden) och översätta hela frasen är som regel själva verkets metaspråk. Grammatikmärken (etiketter) ges vanligtvis med latinska bokstäver, eftersom de är förkortningar av latinska (mindre vanliga, engelska) ord.
Exempel är vanligtvis numrerade. Om verket innehåller exempel från flera språk anges språket före exemplet. Samtidigt, till skillnad från det engelska språket, på det ryska språket är namnet på språket inte versalt (till exempel Dirbal language , men inte Dirbal language ).
Interlinjära glosser för varje enskilt ord i det analyserade språket justeras till vänsterkanten av detta ord (vanligtvis med tabbar ). Till exempel:
(ett) | indonesiska | |||
Mereka | di | Jakarta | sekarang . | |
de | i | Jakarta | nu | |
"De är i Jakarta nu." |
Explicit distingerade morfem separeras från varandra med bindestreck både i den analyserade texten och i motsvarande gloser. Antalet bindestreck i den analyserade texten och i gloserna måste matcha. Till exempel:
(2) | Lezginsky | |||||
Gila | abur-un | ferma | hamishaluǧ | guna | amuq'-da-č. | |
nu | de-OBL-GEN | odla | alltid | Bakom | stanna-FUT-NEG | |
"Nu kommer inte deras gård att vara kvar hela tiden." |
Eftersom avgränsare ( bindestreck ) och vertikal justering ger text ett onaturligt grafiskt utseende, kan författaren eventuellt lägga till en extra rad i början som innehåller rå text, eller hänvisa till regel 4 (särskilt 4C).
Klitikernas gränser anges med ett "lika"-tecken både i källtexten och i gloss.
(3) | västgrönländska | |
palasi=lu | niuirtur=lu | |
präst=och | store_owner=och | |
"både en präst och en butiksägare" |
Epentetiska segment belägna på morfemgränser bör fästas till föregående eller efterföljande morfem. Valet av morfem som ett segment är kopplat till kan bestämmas med olika metoder som är svåra att generalisera, så reglerna ger ingen vägledning i denna fråga.
Regel 2A (utökad version)Om elementen är morfologiskt besläktade, men särskiljda till ett separat ord på prosodisk eller fonologisk grund, kan en kombination av ett mellanslag och ett bindestreck användas som avskiljare (men bara i källspråket, inte inne i glosset).
(fyra) | Chinsky |
a-nii-laay | |
3SG-skratt-FUT | |
"han/hon kommer att skratta" |
Morfem som uttrycker grammatisk betydelse förmedlas huvudsakligen av märken av motsvarande grammatiska kategorier i form av förkortningar skrivna med versaler (oftast små bokstäver ).
Naturligtvis kan det i vissa fall vara nödvändigt att avvika från standardförkortningarna, till exempel om en viss kategori har en hög frekvens på ett visst språk, så kommer det att vara bekvämare att använda en kortare förkortning, till exempel CPL ( istället för COMPL) för att beteckna ett komplex , PF (istället för PRF) för att beteckna det perfekta , etc. Om en kategori har en mycket låg frekvens i språket kan det vara optimalt att inte förkorta dess beteckning alls.
I många fall är användningen av både grammatiska märken och ord från mellanspråket acceptabelt. Sålunda kan något av de två alternativen för glossning (5) väljas, beroende på syftet med glosning.
(5) | ryska | ||||||
Vi | Med | Marco | gå | buss-ohm | i | Peredelkino. | |
1PL | COM | Marco | go-PST-PL | buss-INS | ALLT | Peredelkino | |
vi | Med | Marco | go-PST-PL | buss-genom | i | Peredelkino | |
"Marco och jag åkte till Peredelkino med buss." |
När ett enskilt element i källspråket motsvarar flera element i mellanspråket (lexikaliska gloser eller grammatiska etiketter), separeras sådana element med punkter. Till exempel:
(6) | Deutsch | |
unser-n | Vater-n | |
vår-DAT.PL | fader.PL-DAT.PL | |
"till våra fäder" |
Att bestämma ordningen på element i ett mellanspråk kan bestämmas på en mängd olika sätt som är svåra att generalisera, så reglerna ger ingen vägledning i denna fråga.
Det finns olika anledningar till att det finns en en-till-många-överensstämmelse mellan källspråkselement och glanselement. Att separera element med en punkt används oavsett dessa skäl. Om det fortfarande finns ett behov av att identifiera (separera) olika orsaker bör reglerna 4A-4E hänvisas till.
Regel 4A (förbättrad)Om ett element i källspråket inte kan delas upp i komponenter vare sig formellt eller semantiskt, men det inte finns någon motsvarighet i mellanspråket uttryckt i ett ord, kan ett understreck användas istället för en punkt.
(7) | turkiska |
çık-mak | |
go_out-INF | |
'gå ut' |
Om källspråkselementet inte formellt kan separeras i dess beståndsdelar, men förmedlar två eller flera distinkta betydelser eller grammatiska egenskaper, kan semikolon användas. Till exempel:
(åtta) | franska | |
aux | chevaux | |
till;ART;PL | häst;PL | |
"till hästarna" |
Om ett källspråkselement kan separeras både formellt och semantiskt, men författaren inte vill visa formell uppdelning (eftersom det inte är väsentligt och/eller för att bevara textens integritet) kan ett kolon användas. Till exempel:
(9) | Hettitiska | |||
n=an | apedani | mehuni | essandu. | |
CONN=hans | är:DAT;SG | tid:DAT;SG | har: de: kommer | |
"De kommer att fira det vid den här tiden." |
Om ett grammatiskt särdrag i källspråket uttrycks av en morfonologisk förändring ( ablaut , churn , ändring av ton, etc.), används ett omvänt snedstreck för att separera motsvarande kategorietikett från resten av glosset.
(tio) | Rwanda | |
mú-kòra | ||
SBJV\1PL-arbete | ||
"för att vi ska jobba" | (jfr mù-kòrà indikativ ) |
Om personnummeraffixen presenteras på källspråket som samtidigt uttrycker de agentliknande och patientliknande argumenten för det transitiva verbet, kan '>'-symbolen användas i ordlistan för att indikera att det agentliknande argumentet finns på vänster om det, och det patientliknande argumentet finns till höger.
(elva) | Chamintyung | |
nanggayan | guny-bi-yarluga? | |
WHO | 2DU>3SG-FUT-stabb | |
"Vem vill ni två hugga?" |
Person- och nummerindikatorer separeras inte med en punkt om de är i sekventiell ordning. Till exempel:
(12) | italienska | |
och-iamo | ||
go-PRS.1PL | (inte: go-PRS.1.PL) | |
'vi går' |
På vissa språk är indikatorer på antal och kön mycket vanliga, särskilt i kombination med att ange en person. I sådana fall föredrar vissa författare att använda gemener förkortningar utan att separera dem med punkt. När du använder det här alternativet kommer glansen att se ut som på den andra raden i exempel (13).
(13) | Belhare | ||
född | a-khim-chi | n-yuNNa | |
DEM-LOC | 1SG.POSS-hus-PL | 3NSG-be.NPST | |
DEM-LOC | 1sPOSS-hus-PL | 3ns-be.NPST | |
"Här är mina hus." |
Om glosset innehåller ett element som inte motsvarar ett explicit element i källtexten ( "null" morfem ), så är det omgivet av hakparenteser. Alternativt, istället för ett outtryckt element, läggs tecknet "Ø" till i källtexten, som avgränsas med ett bindestreck, som alla explicita element.
(fjorton) | latin | ||
puer | eller | puer-Ø | |
pojke[NOM.SG] | pojke-NOM.SG | ||
'pojke' | 'pojke' |
Inneboende, icke-explicita kategorier, som kön på vissa språk, kan återges när de är blanka, men med motsvarande element inom parentes. Till exempel:
(femton) | Gunzibsky | ||
ož-di-g | xxe | m-uq'e-r | |
pojke-OBL-AD | trä (G4) | G4-böj-pret | |
"På grund av pojken lutade trädet." | |||
(G4 = 4:e könet, AD = adessiv , PRET = preteritum ) |
Tvåkomponents grammatiska eller lexikala objekt som behandlas som separata morfologiska enheter (t.ex. tvåkomponentstammar som na-xʔu̧ 'höra' i Lakota ) kan återges på två olika sätt:
(i) Genom enkel upprepning av glansen:
(16) | Lakota |
na-wicha-wa-xʔu̧ | |
hör-3PL.UND-1SG.ACT-hör | |
"Jag hör dem." |
(ii) En av de två delarna kan sändas med ett speciellt märke, t.ex. STAM
(17) | Lakota |
na-wicha-wa-xʔu | |
hör-3PL.UND-1SG.ACT-STEM | |
"Jag hör dem." |
Circumfix , som är "tvåkomponentaffixer", kan överföras med samma regler, till exempel:
(arton) | Deutsch | ||
ge-seh-en | eller | ge-seh-en | |
ptcp-se-ptcp | ptcp-se-circ | ||
'sett' | 'sett' |
Både infixen i källtexten och deras motsvarande glanselement omges av vinkelparenteser.
(19) | Tagalog | |
b<um>ili | (bas: bili ) | |
<ACTFOC>köp | ||
'köpa' |
(tjugo) | latin | |
reli<n>qu-ere | (stam: reliqu- ) | |
lämna<PRS>-INF | ||
'lämna' |
Om det inte är svårt att avgöra om infixet är vänsterhänt, som i (19), eller högerhänt, som i (20), bestämmer detta läget för glansen som anger infixet i förhållande till glansen som anger den lexikala stammen. Om infixet inte uttryckligen är vänster- eller högerhänt, bör en separat princip utarbetas genom vilken elementen i glansen kommer att beställas.
Reduplikation skickas på samma sätt som affix , men tilde- tecknet används för att fästa det upprepande elementet på stammen , snarare än ett bindestreck.
(21) | hebreiska |
yerak~rak-im | |
grön~ATT-M.PL | |
"grönaktig" |