BAS PHATT 1.1.X (complete corpus)



BAS PHATT 1.1.X (corpus intégral)




The Ph@ttSessionz speech database, funded by the German Ministry of Science and Education (BMBF), contains recordings of 864 adolescent speakers of German (age range 12-20). The recordings were performed via the WWW in public schools (Gymnasium) in 41 locations in Germany. The speech material recorded is a superset of the German SpeechDat-II and RVG-I corpora (see also ELRA-S0051, S0058, S0063, S0096 and S0155). Recordings were done with SpeechRecorder in selected schools in the years 2005-2007. Both channels, the headset and the desktop microphone, were recorded in high quality.

The BAS PHATT corpus is available in two versions: BAS PHATT 1.0.X (sub-set, ELRA-S0282-01) and BAS PHATT 1.1.X (complete corpus, ELRA-S0282-02).

BAS PHATT 1.1.X contains:
- 138 items:
- 12 single digits
- 18 numbers
- 12 commands
- 30 phonetically rich sentences
- 13 telephone numbers
- 9 digit strings: 3 all digits, 3 credit card numbers, 3 PIN codes
- 3 date expressions
- 12 spelling items: 2 arbitrary sequences, 5 geographical names, 5 person names
- 3 geographical names
- 3 company names
- 2 person names
- 11 phonetics test sentences
- 3 time expressions
- 8 spontaneous texts (text production): 5 short texts, 3 long texts
- Total number of recordings: approx. 120,000
- Duration: ca. 12,500 minutes
- Formats: WAV 22,05kHz, 16 bit, SpeechDat Transliteration, BAS Partitur Format (BPF)
- Segmentation: manual segmentation begin/end utterance, automatic phonemic segmentation with MAUS
- Distribution: 15 DVD-R Iso 9660

See also ELRA-S0082-01.

View resource description in French

La base de données Ph@ttSessionz, financée par le ministère allemand pour la science et l’éducation (BMBF), contient les enregistrements de 864 locuteurs de l’allemand adolescents (entre 12 et 20 ans). Les enregistrements ont été réalisés sur internet dans des écoles publiques (Gymnasium) dans 41 sites en Allemagne. Le matériel oral enregistré est un sur-ensemble des corpus SpeechDat-II allemand et RVG-I (voir aussi ELRA-S0051, S0058, S0063, S0096 et S0155). Les enregistrements ont été réalisés entre 2005 et 2007 avec l’outil “SpeechRecorder” dans une sélection d’écoles. Les deux canaux de microphone (micro-casque et microphone pour PC), ont été enregistrés en haute qualité.

Le corpus BAS PHATT est disponible en deux versions : BAS PHATT 1.0.X (sous-ensemble, ELRA-S0282-01) et BAS PHATT 1.1.X (corpus intégral, ELRA-S0282-02).

BAS PHATT 1.1.X comprend:
- 138 éléments:
- 12 chiffres isolés
- 18 nombres
- 12 mots de commande
- 30 phrases phonétiquement riches
- 13 numéros de téléphone
- 9 chiffres connectés: 3 chiffres, 3 numéros de carte de crédit, 3 codes PIN
- 3 expressions de date
- 12 énumérations: 2 séquences arbitraires, 5 noms géographiques, 5 noms de personnes
- 3 noms géographiques
- 3 noms de société
- 2 noms de personne
- 11 phrases de test phonétique
- 3 expressions de temps
- 8 textes spontanés: 5 textes courts, 3 textes longs
- Nombre total d’enregistrements: env. 120 000
- Durée: ca. 12 500 minutes
- Formats: WAV 22,05kHz, 16 bit, transcription SpeechDat, BAS Partitur Format (BPF)
- Segmentation: segmentation manuelle avec marques de début et fin, segmentation phonémique automatique avec MAUS
- Distribution: 15 DVD-R Iso 9660

Voir aussi ELRA-S0082-01.

