Korankorpus av arabiska | |
---|---|
URL | corpus.quran.com |
Kommersiell | GNU General Public License |
Webbplatstyp | korpus av texter |
Språk) | Arabiska / engelska |
Serverns plats | Storbritannien |
Ägare | Leeds University |
Början av arbetet | 2009 |
Nuvarande status | fungerar och utvecklas |
Arabic Qur'anic Corpus är en sökbar elektronisk korpus online av korantexter som innehåller 77 430 arabiska ord. Syftet med projektet är att tillhandahålla morfologiska och syntaktiska data för forskare som vill studera klassisk arabiska [1] [2] [3] [4] [5] .
Grammatiktextanalys hjälper användare att avslöja de avsedda betydelserna av varje vers och mening. Varje ord i texten i Koranen tillskrivs med en indikation på dess orddel och flera morfologiska egenskaper. Till skillnad från andra arabiska korpus är grammatiken som används av Koranens korpus den traditionella arabiska grammatiken Irab (إعراب). The Qur'anic Corpus of Arabic är ett forskningsprojekt som leds av datavetaren Kays Dukes från University of Leeds [4] och är en del av det arabiska språkstudieprojektet vid School of Computing som leds av Eric Atwell [6] .
Den kommenterade korpusen inkluderar [1] [7] :
Talordsuppmärkning tilldelar varje ord i korpusen en orddeltagg och morfologiska egenskaper - till exempel en indikation på om det givna ordet är ett substantiv eller ett verb , är i maskulinum eller femininum . I projektets första skede användes automatisk delmärkning. Egenskaperna för vart och ett av de 77 430 orden i Koranen förfinas sedan steg för steg av två kommentatorer, och förfiningarna fortsätter till idag.
Språklig forskning som använder Koranens korpus inkluderar undervisning i en dold Markov -modell av arabisk ordspråksuppmärkning [8] , automatisk kategorisering av kapitel i Koranen [9] och prosodisk textanalys [10] .
Dessutom tillhandahåller projektet en bokstavlig översättning av Koranen baserad på accepterade engelska källor istället för en ny översättning av Koranen [4] .
Arabiska språket • العربية | |||||||
---|---|---|---|---|---|---|---|
Recensioner | |||||||
Skrivande | |||||||
Arabiska alfabetet |
| ||||||
Brev | |||||||
periodisering | |||||||
Olika sorter |
| ||||||
Akademisk | |||||||
Kalligrafi |
| ||||||
Lingvistik |
Korpuslingvistik | |
---|---|
engelska korpus |
|
Ryskspråkiga korpus |
|
Corpora på andra språk |
|
Organisationer |