Una nuova piattaforma vocale permetterà il riconoscimento di oltre 60 lingue non presenti su Siri ed Alexa

L’organizzazione non-profit Mozilla, che in passato ha creato il browser web gratuito Firefox, sta lavorando per sviluppare un assistente vocale integrata per le lingue africane, tra cui il Kiswahili, una lingua parlata in Ruanda, Burundi, Kenya, Ugana, Tanzania e Sud Sudan.

Ad oggi, le principali piattaforme vocali, come ad esempio Apple Siri, Google Home, Alexa di Amazon non sono in grado di ascoltare o rispondere a nessuna lingua parlata nel continente africano. La piattaforma Common Voice di Mozilla, che riceve il sostegno dei governi tedesco, britannico e della Bill and Melinda Gates Foundation, si sta impegnando a colmare questa lacuna.

Common Voice è un dataset vocale che ha l’obiettivo di abilitare la tecnologia di attivazione vocale in una qualsiasi delle 7.100 lingue «viventi» attualmente parlate, grazie al contributo volontario degli utenti. Donando la propria voce, si aiutano gli sviluppatori a realizzare strumenti di riconoscimento vocale. Per essere inclusa nel dataset di Common Voice, una registrazione vocale deve essere validata da due utenti diversi.

Ad oggi sono state registrate più di 9.000 ore di audio da 160.000 altoparlanti diversi di 60 lingue diverse, tra cui anche il gallese e molte lingue africane. In aggiunta al dataset di Common Voice, Mozilla sta costruendo un motore di riconoscimento vocale open source chiamato Deep Speech.

Arricchire con il maggior numero possibile di lingue nelle piattaforme vocali è un modo per creare una comunità coesa e inclusiva. Solo per fare un esempio, la lingua Kiswahili è parlata da circa 12 milioni di persone in Ruanda, ma ad oggi non è presente su alcuna piattaforma vocale. L’anno scorso, Common Voice ha ospitato un hackathon a Kigali, la capitale del Ruanda, per creare un set di dati di partenza per il Kiswahili. Ora è il linguaggio in più rapida crescita su Common Voice, con oltre 1.700 ore di presentazione.

La risposta all’hackathon ha dato origine a una startup di soluzioni AI chiamata Digital Umuganda, che prende il nome dalla parola Kinyarwanda per una sorta di cooperazione e comunità.

Proprio di recente, Mozilla ha ricevuto una sovvenzione di 3,4 milioni di dollari per espandere la piattaforma Common Voice in Africa, e Chenai Chair, Advisor speciale per l’Africa ha spiegato che il Kiswahili è solo l’inizio.
Il linguaggio riveste un ruolo fondamentale nell’inclusione e funge da strumento di decodifica per conoscere la storia e approfondire la cultura di un popolo, anche attraverso i racconti della tradizione ed i modi di dire.

L’UNESCO, per esempio, sta promuovendo la tecnologia vocale per documentare la conoscenza indigena, salvare le lingue indigene e aumentare l’accesso alle informazioni.

Ultimi articoli: