Indonesian Speech Data by Mobile Phone_R - 359 Hours

View resource name in all available languages

Base de données orales en indonésien par téléphone portable (lu) - 359 heures

311-413-414-907-0

ID:

ELRA-S0470

Indonesia speech data (reading) is collected from 496 Indonesian native speakers and is recorded in quiet environment. The recording is rich in content, covering multiple categories such as econimics, entertainment, news, figure, letter, and oral. Around 400 sentences for each speaker. The valid data volumn is 360 hours. All texts are manual transcribed with high accuray.

Format:16kHz, 16bit, uncompressed wav, mono channel
Recording environment:quiet indoor environment, without echo
Recording content (read speech):economy, entertainment, news, oral language, numbers, letters
Speaker:496 people from Indonesian; 280 females, accounting for 56%
Device:Android mobile phone: iPhone=3:1
Language:Indonesian
Transcription content:text, time point of speech data, 5 noise symbols, special identifiers
Accuracy rate:95% (the accuracy rate of noise symbols and other identifiers is not included)
Application scenarios:speech recognition, voiceprint recognition

View resource description in French

Les données de parole d'Indonésie (lues) ont été collectées auprès de 496 locuteurs natifs d'Indonésie et sont enregistrées dans un environnement calme. L'enregistrement est riche en contenu, couvrant plusieurs thèmes tels que l'économie, le divertissement, l'actualité, les nombres, les lettres et l'oral. Environ 400 phrases pour chaque locuteur ont été enregistrées. Le volume de données valide est de 360 heures. Tous les textes ont été transcrits manuellement avec une précision élevée.

Format : 16 kHz, 16 bits, wav non compressé, canal mono
Environnement d'enregistrement : environnement intérieur calme, sans écho
Contenu des enregistrements (parole lue) : économie, divertissement, actualités, langage oral, nombres, lettres
Locuteurs : 496 personnes d'Indonésie ; 280 femmes, représentant 56 %
Supports d'enregistrement :téléphone mobile Android et iPhone (répartition 3 pour 1)
Langue : indonésien
Contenu de la transcription : texte, point temporel des données de parole, 5 symboles de bruit, identifiants spéciaux
Taux de précision : 95 % (le taux de précision des symboles de bruit et autres identifiants ne sont pas inclus)
Applications:reconnaissance vocale, reconnaissance d'empreintes vocales

MEMBERacademiccommercial
Licence: Commercial Use - ELRA VAR
57978.50 € submit
57978.50 € submit
NON MEMBERacademiccommercial
Licence: Commercial Use - ELRA VAR
57978.50 € submit
57978.50 € submit

Special offer:

06/10/2022