Följande uppsättning verktyg för bearbetning av naturligt språk är en populär samling programvara för bearbetning av naturligt språk ( (engelska) NLP) [1] . Programvaran innehåller en uppsättning bibliotek , ramverk och paket för symbolisk och statistisk analys av naturligt språk och talbehandling . NLP-verktyg utför vanligtvis meningsdetektering , tokenisering , delar av tal , talmönster , klassificering, klustring, lemmatisering , coreferensanalys och upplösning och liknande.
Paket / bibliotek / ramverk | Programmeringsspråk | Licens | Utvecklaren | Hemsida |
---|---|---|---|---|
AlchemyAPI | C , C++ , C# , Java , Python , Perl , Ruby | Gratisprogram eller kommersiellt | Orkester 8 | [ett] |
Fonemic | C#, C++, Java, Python | en reklamfilm | Fonemic LLC | https://fonemica.ai/ |
Digital Sonata | en reklamfilm | Digital Sonata Pty Ltd | [2] | |
Distinguo | C++ | en reklamfilm | Ultralingua Inc. | [3] |
Ellogon | C / C++ | LGPL | George Petasis | [fyra] |
freeling | C++ | GNU | Universitat Politecnica de Catalunya | [5] Arkiverad från originalet den 6 januari 2013. |
Allmän arkitektur för textteknik | Java | LGPL | GATE-forskning | [6] |
Ling Pipe | Java | royaltyfri eller kommersiell | Alias-i | [7] |
LinguaStream | Java | Gratis forskning | Universitetet i Caen , Frankrike | [åtta] |
MII nlp verktygslåda | Java | LGPL | UCLA Medical Imaging Informatics (MII) Group | [9] |
Modulärt ramverk för ljudigenkänning | Java | BSD | MARF Research and Development Group , Concordia University | [tio] |
MontyLingua | Python , Java | MIT | [elva] | |
Naturligt språk verktygslåda | Pytonorm | GNU | [12] | |
NooJ (baserat på INTEX ) | .NET Framework | Gratis forskning | Universitetet i Franche-Comte , Frankrike | [13] |
Öppna NLP | Java | Apache | Nätgemenskap | [fjorton] |
Stanford NLP | Java | GNU | Stanford Natural Language Processing Group | [femton] |
UIMA | Java / C++ | Apache | Apache | [16] |
Rymlig | Pytonorm | MIT | Explosion AI, etc. | [17] |
naturlig språkbehandling | |
---|---|
Allmänna definitioner | |
Textanalys |
|
Refererar |
|
Maskinöversätta |
|
Identifiering och datainsamling | |
Tematisk modell | |
Peer review |
|
Naturligt språkgränssnitt |