Mozilla veröffentlicht Common Voice 25
Mit Common Voice stellt Mozilla den weltweit größten öffentlichen Datensatz menschlicher Stimmen bereit – kostenlos und für jeden nutzbar. Mozilla hat Version 25 seines Datensatzes veröffentlicht.
Der Markt für Spracherkennung wird von den ganz großen Namen kommerzieller Anbieter dominiert: Amazon, Apple, Google, Microsoft. Darum hat Mozilla im Jahr 2017 das Projekt Common Voice gestartet. Mit Common Voice bietet Mozilla eine kostenlose Alternative an, zu der jeder beitragen kann und die jedem zur Verfügung steht. Damit möchte Mozilla Innovation und Wettbewerb in der Sprachtechnologie auf Basis von Maschinenlernen fördern.
Mozilla Common Voice 25
Der nun veröffentlichte Datensatz Common Voice Scripted Speech 25 beinhaltet für die deutsche Sprache 1.486 Stunden an Daten und ist 34,69 GB groß. In Summe waren 20.466 Menschen am deutschsprachigen Datensatz beteiligt. Der Datensatz Common Voice Spontaneous Speech 3 für spontane Sprache kommt für Deutsch auf unter zwei Stunden an Daten und ist 23,28 MB groß, beigetragen von 23 Personen.
Insgesamt deckt Mozilla Common Voice mit der neuen Version, die wieder Unterstützung für eine neue Sprachen bringt, 290 Sprachen mit insgesamt 41.792 aufgenommenen Stunden ab, was Mozilla Common Voice zum vielfältigsten mehrsprachigen Sprachkorpus der Welt macht. Die Anzahl der unterstützten Sprachen für spontane Sprache ist von 62 auf 72 Sprachen gewachsen.
Zum Download der Mozilla Common Voice Datensätze
Zu Mozilla Common Voice beitragen
Der Beitrag Mozilla veröffentlicht Common Voice 25 erschien zuerst auf soeren-hentzschel.at.
