Mozilla veröffentlicht Common Voice 25
Mit Common Voice stellt Mozilla den weltweit größten öffentlichen Datensatz menschlicher Stimmen bereit – kostenlos und für jeden nutzbar. Mozilla hat Version 25 seines Datensatzes veröffentlicht.
Der Markt für Spracherkennung wird von den ganz großen Namen kommerzieller Anbieter dominiert: Amazon, Apple, Google, Microsoft. Darum hat Mozilla im Jahr 2017 das Projekt Common Voice gestartet. Mit Common Voice bietet Mozilla eine kostenlose Alternative an, zu der jeder beitragen kann und die jedem zur Verfügung steht. Damit möchte Mozilla Innovation und Wettbewerb in der Sprachtechnologie auf Basis von Maschinenlernen fördern.
Mozilla Common Voice 25
Der nun veröffentlichte Datensatz Common Voice Scripted Speech 25 beinhaltet für die deutsche Sprache 1.486 Stunden an Daten und ist 34,69 GB groß. In Summe waren 20.466 Menschen am deutschsprachigen Datensatz beteiligt. Der Datensatz Common Voice Spontaneous Speech 3 für spontane Sprache kommt für Deutsch auf unter zwei Stunden an Daten und ist 23,28 MB groß, beigetragen von 23 Personen.
Insgesamt deckt Mozilla Common Voice mit der neuen Version, die wieder Unterstützung für eine neue Sprachen bringt, 290 Sprachen mit insgesamt 41.792 aufgenommenen Stunden ab, was Mozilla Common Voice zum vielfältigsten mehrsprachigen Sprachkorpus der Welt macht. Die Anzahl der unterstützten Sprachen für spontane Sprache ist von 62 auf 72 Sprachen gewachsen.
Zum Download der Mozilla Common Voice Datensätze
Zu Mozilla Common Voice beitragen
Der Beitrag Mozilla veröffentlicht Common Voice 25 erschien zuerst auf soeren-hentzschel.at.

Die digitale Souveränität wird in Europa zum Schlüsselthema. Regierungen und Firmen müssen sich jetzt ernsthaft damit auseinandersetzen. US-Gesetze wie der Cloud Act bedrohen unsere Datenfreiheit. Diese unsichere Lage erfordert echte Alternativen. Das Schweizer Unternehmen Proton liefert nun eine Lösung. Proton stellt den neuen Workspace für Europa vor. Dieser Dienst vereint alle wichtigen Produktivitätstools. Damit bricht […]
"Situation Monitors" über den Iran schaffen Verwirrung, nicht Aufklärung - zumindest solange man nicht zwischen Open Source Information und Open Source Intelligence unterscheidet. (



Die GNOME‑Gemeinschaft richtet den Blick bereits auf die kommende Ausgabe des beliebten Linux‑Desktops. Die Veröffentlichung von GNOME 51 ist für den 16. September 2026 geplant und markiert den nächsten Schritt nach dem frischen GNOME 50 Release. Die Entwickler haben die Arbeit am neuen Zyklus direkt nach dem Start von GNOME 50 aufgenommen. Konkrete Neuerungen sind […]
Oracle liefert eine neue Kernelgeneration für Oracle Linux. Der Unbreakable Enterprise Kernel (UEK) 8.2 basiert auf Linux 6.12 LTS und setzt auf mehr Sicherheit und bessere Leistung. Besonders vertrauliche Workloads sollen von den Neuerungen profitieren. Ein zentrales Highlight ist die Unterstützung von Intel TDX. Diese Technik schützt virtuelle Maschinen durch isolierte und verschlüsselte Bereiche. Oracle […]