Microsoft Speech API

Den aktuella versionen av sidan har ännu inte granskats av erfarna bidragsgivare och kan skilja sig väsentligt från versionen som granskades den 3 december 2014; kontroller kräver 6 redigeringar .

Speech Application Programming Interface (SAPI) är ett COM - baserat applikationsprogrammeringsgränssnitt för taligenkänning och -syntes.

Taligenkänning

Taligenkänning är processen att omvandla talade ord till tryckt text. Taligenkänning inkluderar:

Identifieraren (textigenkänningsmotorn) jämför den igenkända texten iterativt med programmets grammatikregler och, om texten matchar en serie regler, genererar en XML -utdataström med Semantic Markup Language (SML) .  Utdataströmmen innehåller den igenkända texten, korrekta igenkänningssannolikheter och kan innehålla semantiska värden som tilldelas med semantiktolkningsmarkering . Igenkänd text används vanligtvis för datainmatning med diktering och för att styra applikationer med talkommandon.

Storleken på grammatikregler begränsar möjligheten för textigenkänning. De flesta program som stöder diktering är inställda på en viss användares talmönster för att säkerställa den mest exakta igenkänningen. Talkommandokontrollläget är lättare att implementera, eftersom innehållet i grammatikreglerna är begränsat till tillgängliga kommandon [1] .

Talsyntes

Talsyntes är processen att omvandla text till talade ord. Talsyntes inkluderar:

Text-till-tal-motorer kan använda en av två röstsyntesmetoder:

Anteckningar

  1. Tomashenko N. A., Khokhlov Yu. Yu.// STUDIE AV PROBLEMET MED DATABALANS VID KONSTRUKTION AV AKUSTISKA MODELLER AV AUTOMATISKA TARGENKÄNNINGSSYSTEM Arkivexemplar daterad 19 september 2015 på Wayback Machine . - Artikel. - Instrumentering. - UDC 004.934

Länkar

Vi introducerar Computer Speech Technology  (engelska)  (inte tillgänglig länk) . MSDN bibliotek . Microsoft (2012). Hämtad 24 juli 2012. Arkiverad från originalet 29 september 2012.