Surface parsing ( eng. shallow parsing, chunking, light parsing ) är en meningsanalysmetod där de ingående delarna av en mening (substantiv, verb, adjektiv etc.) först identifieras, och sedan länkas de till element av högre ordning som har grammatisk betydelse ( nominella grupper eller fraser, verbgrupper, etc.).
Medan enkla ytanalysalgoritmer länkar samman beståndsdelar med hjälp av elementära sökmönster (t.ex. reguljära uttryck ), kan maskininlärningsbaserade tillvägagångssätt ( klassificerare , ämnesmodellering , etc.) ta hänsyn till kontextuell information och bilda fragment som bättre återspeglar de semantiska länkarna mellan huvudord [1] . Dessa förbättrade metoder löser alltså problemet att en kombination av elementära beståndsdelar kan ha olika betydelser på högsta nivå beroende på meningens sammanhang.
I likhet med lexikal analys i datorspråk, används denna teknik i stor utsträckning i naturlig språkbehandling .
Kallas Shallow Structure Hypothesis och används för att förklara varför andraspråksinlärare ofta misslyckas med att tolka komplexa meningar korrekt [2] .
naturlig språkbehandling | |
---|---|
Allmänna definitioner | |
Textanalys |
|
Refererar |
|
Maskinöversätta |
|
Identifiering och datainsamling | |
Tematisk modell | |
Peer review |
|
Naturligt språkgränssnitt |