Gemensam röst

gemensam röst

Sorts röstdataset [d] ochcrowdsourcing
Utvecklaren Mozilla Foundation
Gränssnittsspråk Flerspråkig ( lista över språk )
Första upplagan 19 juni 2017  ( 2017-06-19 )
Licens Creative Commons CC0
Hemsida commonvoice.mozilla.org
 Mediafiler på Wikimedia Commons

Common Voice  är ett crowdsourcet projekt som lanserats av Mozilla för att skapa en gratis databas för taligenkänningsprogram . Projektet stöds av frivilliga som spelar in exempelmeningar med mikrofon och lyssnar på andra användares inspelningar. De transkriberade meningarna kommer att sammanställas i en databas med röster som är tillgängliga under CC0 -licensen för allmän egendom . Denna licens säkerställer att utvecklare kan använda denna databas för röstapplikationer utan begränsningar eller kostnader.

Common Voice kom till som ett svar på stora företags röstassistenter som Amazon Echo , Siri eller Google Assistant .

Röstdatabas

Den engelska Common Voice-databasen är den näst största fritt tillgängliga röstdatabasen efter LibriSpeech. När de första uppgifterna publicerades den 29 november 2017 hade mer än 20 000 användare över hela världen registrerat 400 000 bekräftade förslag, med en total varaktighet på 500 timmar. [ett]

I februari 2019 släpptes den första satsen språk. Det inkluderade 18 språk: engelska , franska , tyska och mandarinkinesiska , men också mindre vanliga språk som walesiska och kabyle . Totalt inkluderade det nästan 1 400 timmar av inspelad röstdata från över 42 000 bidragsgivare. [2]

Anteckningar

  1. Tillkännage den första lanseringen av Mozillas taligenkänningsmodell med öppen källkod och röstdataset . blogg mozilla.org (29 november 2017). Hämtad 14 februari 2020. Arkiverad från originalet 29 november 2017.
  2. Mozilla uppdaterar Common Voice-dataset med 1 400 timmars tal på 18 språk . Venture Beat (28 februari 2019). Hämtad 14 februari 2020. Arkiverad från originalet 4 mars 2019.