Scottish National Corpus

Den aktuella versionen av sidan har ännu inte granskats av erfarna bidragsgivare och kan skilja sig väsentligt från versionen som granskades den 22 november 2017; kontroller kräver 2 redigeringar .

Scottish Corpus of Text and Speech ( Scottish Corpus of Text and Speech) är det skotska (germanska) språkets nationella korpus , skapat 2004 av en grupp experter: medlemmar av English Language Project och Stella Project of School of Critical Studier vid University of Glasgow .

Bakgrund till skapandet av "THE SCOTS"

Under de senaste åren har det skett betydande förändringar i den politiska situationen i Skottland. Den nya politiska rörelsen återupplivade intresset för lokala språk och kultur. I Skottland är det språkliga arvet ljust, isolerat från andra. Den moderna språksituationen här är mycket rik, eftersom skotska, engelska, gaeliska och många andra språkgemenskaper samexisterar här. Frågor som bevarandet av det skotska språket, de utmärkande egenskaperna hos skotsk engelska eller användningen av främmande språk som kinesiska eller urdu har dock inte tillräckligt med data och entydiga svar. Och denna brist på information skapar betydande problem för dem som arbetar inom utbildningsområdet eller helt enkelt är intresserade av denna fråga.

Modern teknik har gjort det möjligt att lagra och analysera mycket stora mängder information. Och "THE SCOTS" är det första storskaliga projektet som exklusivt ägnas åt Skottlands språk. Det tillhandahåller en stor elektronisk korpus av skrivna och talade texter för språken i detta land. Korpusen har funnits sedan november 2004, och efter regelbundna uppdateringar och tillägg, i maj 2007 nådde antalet ord på sajten 4 miljoner. Förhoppningen är att för dem som är intresserade av Skottlands språkliga mångfald kommer THE SCOTS att ge svar på alla sina frågor. Korpusen har möjlighet att utforska Skottlands språk på nya sätt och överbrygga de klyftor som för närvarande finns i vår kunskap om dem.

SCOTS

När det gäller själva fodralet ger det intrycket av ett modernt, extremt bekvämt, lättanvänt fodral, som ständigt utvecklas och kan svara på många frågor. Så till exempel kan alla som har någon form av kommentarer skicka sina önskemål till skaparna via e-post, där de i sin tur kan överväga dem och göra lämpliga justeringar.

Sammansättning av kåren

The Scottish Corpus innehåller för närvarande över 1 100 skrivna och talade texter, totalt över 4 000 000 ord. 80 % är skriftliga texter, 20 % är muntliga texter, som tillhandahålls oss i form av ortografisk transkription, synkroniserad med ljud- eller bildkällan.

En av korpusens funktioner är att visa hela texter där det är möjligt, vilket gör korpusen märkbart mer folkrik. I vissa fall, på grund av upphovsrättstillstånd, kan endast en del av texten visas. I "SCOTS" är den information som presenteras hämtad från källor från 1945 till idag. SCOTS strävar efter att uppnå rättvisa för ett brett spektrum av texter, texter på olika språk, genrer och register; presentera talare eller författare i största möjliga utsträckning efter genre, ålder, kön, yrkesmässiga och geografiska egenskaper.

Söktyper

Det finns tre olika sökmetoder. De användare som är intresserade av statistisk information, såsom den relativa frekvensen av vissa ord i olika genrer, kan använda skotsk data i denna riktning. Beroende på mängden information som efterfrågas kan du välja en snabb, standard eller avancerad söktyp.

Snabbsökning

Snabbsökning är det enklaste sättet att hitta hur ofta ordet du är intresserad av använder i olika ljudfiler och textdokument. Som ett resultat får du ordets frekvens och formatet på filerna som det används i.

Standardsökning

Standardsökningen låter dig utföra några enkla typer av sökningar och låter dig även se alla dokument i korpusen.

Avancerad sökning

Avancerad sökning ger ett bredare utbud av alternativ än den vanliga. Här är den huvudsakliga statistiska informationen, konkordancern och kartorna som resultaten visas på. Den avancerade sökningen är uppdelad av sökkriterier, som kan ställas in för att begränsa sökningen efter ord i texter i ett visst läge (muntligt eller skriftligt tal), genre (korrespondens, fiktion, intervjuer) eller med en viss uppsättning kriterier (konversationer) efter 2000, professionella vetenskapliga artiklar etc.) Ytterligare). Således kan resultaten av olika sökfrågor överensstämma med varandra.

Anteckningar

När du söker med snabb- eller standardsökning kommer du till en resultatsida med två huvuddelar: en sammanfattning av sökresultaten och en lista med dokument.

Kompilatorer

Förutom University of Glasgow deltog specialister från följande organisationer i projektet:

Åtkomst

För närvarande är endast korpussökning gratis.

Litteratur

Länkar