Japanese Kids Speech database (Upper Grade)

View resource name in all available languages

Base de données audio d'enfants japonais (niveau cours moyen et collège)

846-295-092-462-7

ID:

ELRA-S0412

The Japanese Kids Speech database (Upper Grade) contains the total recordings of 232 Japanese Kids speakers (104 males and 128 females), from 9 to 13 years’ old (fourth, fifth and sixth graders in elementary school), recorded in quiet rooms using smartphones. This database may be combined with the Japanese Kids Speech database (Lower Grade) also available in the ELRA Catalogue under reference ELRA-S0411.

Number of speakers, utterances and duration, age are as follows :
Number of speakers 232 (104 male/128 female)
Number of utterances (average): 385 utterances per speaker
Total number of utterances: 89,454
Age: from 9 to 13 years' old
Total hours of data: 145.4

1018 sentences were used. Recordings were made through smartphones and audio data stored in .wav files as sequences of 16KHz Mono, 16 bits, Linear PCM.

Database:
・Audio data: WAV format, 16KHz, 16bit, mono (recorded with smartphone)
・Recording scripts: TSV format(tab-delimited), UTF-8 (without BOM)
・Transcription data: TSV format(tab-delimited), UTF-8 (without BOM)
・Size: 16.2GB

Number of speakers per age:
9 years' old: 56 (21 male, 35 female)
10 years' old: 71 (30 male, 41 female)
11 years' old: 65 (28 male, 37 female)
12 years' old: 38 (24 male, 14 female)
13 years' old: 2 (1 male, 1 female)

Structure of database:
├─ readme.txt
├─ Japanese Kids Speech Database.pdf Description document of the database
├─ Transcription.tsv Transcription
├─ scripts.tsv Script

└─ voices/ directory of audio data
├─ high/ directory of upper grade
└─(speaker_ID/) directory of speaker ID (six digits)
└─(audio_file) audio file (WAV format, 16KHz, 16bit, mono)

File naming conventions of audio files are as follows:
Field number | Contents | Description | Remarks
0 | Language ID | “JA” (fixed) | Japanese
1 | Speaker ID | Six digit | 5XXXXX
2 | Script ID | HXXXX | XXXX: four digits
3 | Age | Two digits
4 | Gender | M: male, F: female

Filed separation character is “_”.
For example, if the audio file name is “JA_500002_H0001_10_F.wav, this file has the following meaning:
JA: Language ID (Japanese)
500002: speaker ID
H0001: script ID
10: age (ten years old)
F: gender (female)

View resource description in French

La base de données audio d'enfants japonais (niveau cours moyen et collège) contient les enregistrements de 232 enfants japonais (104 garçons et 128 filles), âgés de 9 à 13 ans (élèves de cours moyen et de première et deuxième année de collège), enregistrés dans des salles calmes en utilisant des smartphones. Cette base de données peut être complétée par la Base de données audio d'enfants japonais (niveau cours élémentaire) également disponible dans le catalogue ELRA sous la référence ELRA-S0411.

Le nombre de locuteurs, les propos et la durée, l'âge sont les suivants:
Nombre de locuteurs: 232 (104 hommes, 128 femmes)
Nombre d'occurrences (moyennes): 385 occurrences par locuteur
Nombre total d'occurrences: 89 454
Age: de 9 à 13 ans
Nombre total d'heures de données: 145,4

1018 phrases ont été utilisées. Les enregistrements ont été réalisés via des smartphones et les données audio sont stockées dans des fichiers .wav sous forme de séquences de 16KHz mono, 16 bits, PCM linéaire.

Base de données
・ Données audio: format WAV, 16 KHz, 16 bits, mono (enregistrées avec un smartphone)
・ Scripts d'enregistrement: format TSV (délimité par des tabulations), UTF-8 (sans BOM)
・ Données de transcription: format TSV (délimité par des tabulations), UTF-8 (sans BOM)
・ Taille: 16,2 Go

Répartition par âge:
9 ans: 56 (21 garçons, 35 filles)
10 ans: 71 (30 garçons, 41 filles)
11 ans: 65 (28 garçons, 37 filles)
12 ans: 38 (24 garçons, 14 filles)
13 ans: 2 (1 garçon, 1 fille)

Structure de la base de données:
├─ readme.txt
├─ Japanese Kids Speech Database.pdf Document de description de la base de données
├─ Transcription.tsv Transcription
├─ scripts.tsv Script

└─ voices/ répertoire de données audio
└─ high/ répertoire des classes de niveau cours moyen et collège
└─(speaker_ID/) répertoire des identifiants des locuteurs (six chiffres)
└─(audio_file) fichiers audio (format WAV, 16KHz, 16bit, mono)

Les conventions de nommage des fichiers audio sont les suivantes:
Numéro du champ | Contenu | Description | Remarques
0 | Identifiant de la langue | “JA” (fixed) | Japanese
1 | Identifiant du locuteur | Six chiffres | 5XXXXX
2 | Identifiant du script | HXXXX | XXXX: quatre chiffres
3 | Age | Deux chiffres
4 | Sexe | M: garçon, F: fille

Le caractère de séparation est «_».
Par exemple, si le nom du fichier audio est « JA_500002_H0001_10_F.wav » , ce fichier a la signification suivante:
JA: ID de langue (japonais)
500002: identifiant du locuteur
H0001: identifiant du script
10: âge (dix ans)
F: sexe (femme)

MEMBERacademiccommercial
Licence: Non Commercial Use - ELRA END USER
5125.00 € submit
30750.00 € submit
Licence: Commercial Use - ELRA VAR
30750.00 € submit
30750.00 € submit
NON MEMBERacademiccommercial
Licence: Non Commercial Use - ELRA END USER
20500.00 € submit
30750.00 € submit
Licence: Commercial Use - ELRA VAR
30750.00 € submit
30750.00 € submit
08/10/2020

People who looked at this resource also viewed the following: