Översättningsminne
Översättningsminne (PP, engelskt översättningsminne , TM, ibland även kallat en "översättningsenhet") är en databas som innehåller en uppsättning tidigare översatta textsegment .
Beskrivning
En databaspost i översättningsminnet motsvarar ett segment eller " översättningsenhet " ( engelsk översättningsenhet ), som vanligtvis tas som en mening (mindre ofta, en del av en sammansatt mening eller stycke ). Om översättningsenheten i källtexten exakt matchar översättningsenheten som är lagrad i databasen ( exakt matchning ), kan den automatiskt ersättas med översättningen . Det nya segmentet kan också skilja sig något från det som lagras i databasen (fuzzy match, English fuzzy match ). Ett sådant segment kan också ersättas i översättningen, men översättaren måste göra de nödvändiga ändringarna.
Förutom att påskynda processen med att översätta repetitiva fragment och ändringar som gjorts i redan översatta texter (till exempel nya versioner av mjukvaruprodukter eller ändringar i lagstiftningen), säkerställer PP-system också enhetligheten i översättningen av terminologi i samma fragment, vilket är särskilt viktigt för teknisk översättning. Å andra sidan, om en översättare regelbundet byter ut exakta matchningar från översättningsminnet till sin översättning utan kontroll över deras användning i ett nytt sammanhang, kan kvaliteten på den översatta texten försämras.
I varje specifikt PC-system lagras data i sitt eget format (textformat i Wordfast, Access-databas i Deja Vu), men det finns en internationell standard TMX ( English Translation Memory eXchange format ), som bygger på XML och kan genereras av nästan alla PC-system. Tack vare detta kan de gjorda översättningarna användas i olika applikationer, det vill säga en översättare som arbetar med OmegaT kan använda BT som skapats i Trados och vice versa.
De flesta mjukvarusystem stöder åtminstone skapandet och användningen av användarlexikon, skapandet av nya databaser baserade på parallella texter ( engelsk alignment ), samt halvautomatisk extraktion av terminologi från original- och parallelltexter.
Populära PP-programvarusystem
Enligt recensioner av användningen av PP-system inkluderar de mest populära systemen [1] [2] :
- memoQ
- XTM Cloud
- Minneskälla
- Deja vu
- OmegaT (gratis system licensierat under GNU GPL )
- SDLX [3]
- Trados
- SmartCAT (gratis programvara med inbyggd PDF-igenkänning)
- STAR Transit
- Wordfast (implementerat som en uppsättning makron för MS Word , ny 2009-version är en separat applikation)
Den engelska Wikipedia har en lista som jämför kapaciteten hos olika system.
Standarder och format för översättningsminne [4]
- TMX (Translation Memory Exchange Format - Translation Memory Exchange). Denna standard tillåter utbyte mellan olika leverantörer av översättningsminnen. TMX är ett vanligt förekommande format bland översättare och lämpar sig bäst för import och export av översättningsminnen. Den senaste versionen av detta format, 1.4b, låter dig återställa originaldokument och deras översättning från en TMX-fil.
- TBX (Termbase Exchange format - termbase exchange). Detta format för Localization Industry Standards Association (LISA) revideras för närvarande och ges ut på nytt enligt ISO 30042 . Denna standard möjliggör utbyte av terminologi, inklusive detaljerad lexikal information. Huvudbasen för TBX definieras av standarder: ISO 12620 , ISO 12200 och ISO 16642 . ISO 12620 tillhandahåller ett register över väldefinierade "datakategorier" med standardiserade namn som fungerar som dataelementtyper eller fördefinierade värden. ISO 12200 (även känd som MARTIF ) tillhandahåller ramverket för TBX-ramverket. ISO 16642 (även känd som Terminological Markup Framework ) inkluderar en strukturell metamodell för Terminological Markup Languages i allmänhet.
- SRX är utformad för att förbättra TMX-formatet och göra överföringen av översättningsminnen mer effektiv mellan program. Möjligheten att specificera segmenteringsreglerna som användes i den tidigare översättningen förbättrar effektiviteten för att identifiera segment i den aktuella texten med innehållet i PG.
- GMX GILT står för globalisering, internationalisering, lokalisering och översättning (Globalisering, internationalisering , lokalisering , översättning). GILT Metrics- standarden består av tre delar: GMX-V för volymmått, GMX-C för komplexitetsmätningar och GMX-Q för kvalitetsmätningar. Den föreslagna GILT Metrics-standarden syftar till att kvantifiera omfattningen av arbetet och kvalitetskraven för implementeringen av GILT-målen.
- OLIF är en XML -kompatibel öppen standard som används för att utbyta terminologiska och lexikaliska data. Även om det ursprungligen användes som ett sätt att utbyta lexikal data mellan privata maskinöversättningslexikon, har detta format gradvis utvecklats till en mer allmän terminologisk utbytesstandard.
- XLIFF (XML Localization Interchange File Format ) är utformat som ett enda utbytesfilformat som känns igen av all lokaliseringsprogramvara. XLIFF är det bästa sättet att utbyta information i XML-format i dagens översättningsindustri. Vissa verktyg använder proprietära XLIFF-format som inte tillåter att filer skapade i dem öppnas i andra program.
- TransWS (Translation Web Services - översättningswebbtjänster), definierar de parametrar som krävs för att anropa webbtjänster när du skickar och tar emot filer och meddelanden relaterade till lokaliseringsprojekt. Det var tänkt som ett utrullat system för att automatisera lokaliseringsprocessen med hjälp av tjänster på Internet .
- xml:tm , detta tillvägagångssätt för översättningsminne är baserat på begreppet textminne, som tillåter kombinationen av författarens minne och översättningsminne. XML:tm-formatet gavs till Lisa OSCAR av XML-INTL .
Fördelar och nackdelar
Fördelar
- Minska tiden och volymen för översättarens arbete.
- Förbättra översättningskonsistensen, särskilt när en grupp översättare arbetar med samma projekt.
- Öka vinsterna genom att öka produktiviteten hos översättaren, en grupp översättare.
- Förbättra kvaliteten på tjänsterna genom att öka noggrannheten och enhetligheten i översättningen av termer, särskilt i specialiserade texter.
Nackdelar
- Kan göra översättningen mer "torr"; själva essensen av texten går förlorad om översättningen som använder översättningsminnet utförs av en lågutbildad översättare.
- Ofta finns det inget samband mellan meningen/texten som programmet föreslår med angränsande meningar och med texten som helhet.
- Originalet måste vara i elektronisk form.
- Ett oupptäckt fel kan spridas till hela projektet.
- Det är nödvändigt att lära sig hur man arbetar i själva programmet, och när man byter jobb, kanske mer än en gång (om arbetsgivare använder olika TM-program).
- Inte lämplig för alla typer av texter.
- Hög kostnad för licensierad programvara.
Se även
Anteckningar
- ↑ Se sidan 26 i Imperial College London Translation Memories Survey 2006 Arkiverad 2007-03-25. (PDF)
- ↑ ITI Translation Memory Survey, 2007 (nedlänk) (nedlänk från 2013-05-13 [3456 dagar])
- ↑ Som ett resultat av det brittiska företaget SDL Internationals förvärv i juni 2005 av Trados 2006, dök en enda produkt upp TRADOS SDLX 2006
- ↑ Standarder för Localization Industry Standards Association (LISA).
Litteratur
- Grabovsky VN Technology Översättningsminne // Broar. Journal of Translators. 2004. Nr 2. - S. 57-62.
Länkar