Alcohol Language Corpus (BAS ALC)

View resource name in all available languages

Corpus ALC (Alcohol Language Corpus - BAS ALC)




ALC contains recordings of German speakers that are either intoxicated or sober. The type of speech ranges from read single digits to full conversation style. Recordings were done during drinking test where speakers drank beer or wine to reach a self-chosen level of alcoholic intoxication. The actual level of intoxication was measured by breath alcohol and blood samples taken immediately before the speech recording. Recordings were performed in two standing automobiles to ensure a constant acoustic environment across the different recording locations; both, the intoxicated and sober condition recording were done in the same car and supervised by the same investigator (dialogue partner). In the intoxicated state 30 items were sampled from each speaker (set A), while in the sober state 60 items were recorded (set NA; set A being a subset of set NA).

Preliminary version of 25/03/2009:
• number of recorded speakers: 88 (final: 150)
• number of recordings: 8586
• number of phonetic segments: 709220
• file formats:
o headset Beyerdynamics Opus 54: WAV 44,1kHz, 16 bit
o mouse micro AKG 400: WAV 44,1kHz, 16 bit
o meta data: speaker and recording protocol (SpeechDat)
o lexicon: 7-bit ASCII
o Emu database: *.hlb, *.phonetic
• segmentation: manual segmentation of initial and final silence interval; automatic phonemic segmentation by MAUS
• distribution: DVD-R

The final version will be made available free of charge to the preliminary version purchasers after completion (planned for end 2009).

View resource description in French

ALC comprend les enregistrements de locuteurs allemands dans des conditions de sobriété et d'ébriété. Le type de parole enregistrée va des chiffres lus à un style de conversation complet. Les enregistrements ont été réalisés pendant le test de boisson au moment où les locuteurs buvaient de la bière ou du vin dans le but d’atteindre un niveau d’intoxication alcoolique déterminé selon la volonté de chacun. Le niveau réel d’ébriété a été mesuré à partir d’échantillons de souffle et de sang prélevés immédiatement après l’enregistrement. Les enregistrements ont été effectués dans deux automobiles standard afin d’assurer un environnement acoustique constant à travers les différents sites d’enregistrements; les enregistrements en état de sobriété et d’ébriété ont été effectués dans la même voiture et supervisés par le même « enquêteur » (partenaire de dialogue). Pour l’état d’ébriété, 30 éléments ont été échantillonnés pour chaque locuteur (ensemble A), tandis que pour la sobriété 60 éléments ont été enregistrés (ensemble NA; l’ensemble A étant un sous-ensemble de NA).

Version préliminaire du 25/03/2009:
• nombre de locuteurs enregistrés: 88 (final: 150)
• nombre d’enregistrements: 8586
• nombre de segments phonétiques: 709220
• formats de fichiers:
o casque Beyerdynamics Opus 54: WAV 44,1kHz, 16 bit
o micro AKG 400: WAV 44,1kHz, 16 bit
o métadonnées: protocole de locuteur et d’enregistrement (SpeechDat)
o lexique: 7-bit ASCII
o base de données Emu: *.hlb, *.phonetic
• segmentation: segmentation manuelle de l’intervalle de silence initiale et final; segmentation phonémique automatique par MAUS
• distribution: DVD-R

La version finale sera rendue disponible gratuitement aux acquéreurs de la version préliminaire une fois terminée (prévue pour la fin 2009).

Licence: Non Commercial Use - ELRA END USER
510.00 € submit
510.00 € submit
Licence: Commercial Use - ELRA VAR
510.00 € submit
510.00 € submit
NON MEMBERacademiccommercial
Licence: Non Commercial Use - ELRA END USER
1020.00 € submit
1020.00 € submit
Licence: Commercial Use - ELRA VAR
1020.00 € submit
1020.00 € submit
People who looked at this resource also viewed the following: