ÌròyìnSpeech

012-405-700-001-6

ID:

ELRA-S0492

A modern, high-fidelity, multi-speaker, Yorùbá read speech corpus suitable for Speech Synthesis, Automatic Speech Recognition and Computational Linguistics research. The subject matter is drawn from the Broadcast News domain as well as fictional texts, delivering a multi-purpose, contemporary speech dataset.
This corpus consists in 34000 read sentences, 42 hours of audio recorded under 48kHz, 16bit Linear PCM WAV format, for ca. 12.5 Gigabytes.

View resource description in French

Corpus de parole lu en Yorùbá moderne, de très bonne qualité, multi-locuteurs, adapté à la recherche en synthèse et reconnaissance automatique de la parole et à la linguistique computationnelle. Le sujet traité est issu du domaine des actualités de télé-radio-diffusion ainsi que des textes de fiction, proposant une base de données de parole contemporaine multi-usages.
Le corpus comprend 34000 phrases lues, 42 heures de données audio enregistrées au format 48kHz, 16bit Linear PCM WAV, pour env. 12.5 gigaoctets.

MEMBERacademiccommercial
Licence: Non Commercial Use - ELRA END USER
0.00 € submit
11200.00 € submit
Licence: Commercial Use - ELRA VAR
11200.00 € submit
11200.00 € submit
NON MEMBERacademiccommercial
Licence: Non Commercial Use - ELRA END USER
0.00 € submit
12000.00 € submit
Licence: Commercial Use - ELRA VAR
12000.00 € submit
12000.00 € submit
17/05/2024
People who looked at this resource also viewed the following: