Contexte du lancement
WAXAL répond à un défi majeur : sur plus de 2 000 langues africaines, moins de 5% disposent de ressources suffisantes pour l'IA vocale, excluant des millions de personnes des assistants vocaux, transcriptions et outils d'IA. Lancé officiellement début février 2026, ce dataset contient plus de 11 000 heures d'enregistrements vocaux issus de près de deux millions d'échantillons individuels, incluant 1 250 heures de parole naturelle transcrite et plus de 20 heures d'enregistrements studio pour des voix synthétiques réalistes. Aisha Walcott-Bryant, responsable de Google Research Africa, souligne que WAXAL permet aux communautés africaines de développer des technologies adaptées à leurs contextes locaux.Les langues couvertes et les partenaires
La base couvre 21 langues clés comme le haoussa, le yoruba, l'igbo, le luganda, le swahili, l'acholi, le peul et l'ikposo, parlées par des centaines de millions de personnes en Afrique de l'Ouest, de l'Est et du Centre. Des institutions africaines leaders ont piloté la collecte : l'université Makerere (Ouganda), l'université du Ghana, Digital Umuganda (Rwanda) et l'Institut africain des sciences mathématiques (AIMS). Plus de 7 000 volontaires au Ghana seul ont contribué, et les partenaires conservent la propriété des données tout en les rendant accessibles mondialement.Impacts attendus sur l'IA africaine
WAXAL boostera les applications en éducation, santé, agriculture et commerce, rendant les outils vocaux accessibles aux locuteurs non anglophones. Joyce Nakatumba-Nabende, maître de conférences à Makerere, insiste : « Pour que l'IA impacte l'Afrique, elle doit parler nos langues et comprendre nos contextes ». Isaac Wiafe, professeur associé à l'université du Ghana, prévoit une innovation accélérée dans ces secteurs grâce à ces données de qualité. Open-source, WAXAL favorise startups et chercheurs locaux, comme Lelapa AI en Afrique du Sud avec Vulavula.