TRAD Pashto Broadcast News Speech Corpus

View resource name in all available languages

Corpus TRAD d’actualités radio et télédiffusées en pachto

918-508-885-913-7

ID:

ELRA-S0381

This corpus contains transcribed broadcast news recordings in Pashto. Recordings are collected from 5 sources: Ashna TV, Azadi Radio, Deewa Radio, Mashaal Radio and Shamshad TV.

The corpus contains 108 hours of recordings covering more than 1,000 speakers. Transcriptions are provided together with the audio files and include about 46,000 segments and 1.1M words.

Pashto is an indo-iranian language spoken by the Pashtun people mainly in Pakistan and Afghanistan.

This corpus was produced by ELDA within the PEA TRAD project supported by the French Ministry of Defence (DGA).

View resource description in French

Le corpus contient des enregistrements d’émissions radio et télé diffusées en pachto provenant des 5 sources suivantes : Ashna TV, Azadi Radio, Deewa Radio, Mashaal Radio et Shamshad TV.

Le corpus comprend 108 heures d’audio avec les voix de plus de 1.000 locuteurs. Les transcriptions sont fournies avec l’audio et contiennent environ 46.000 segments et 1,1M de mots.

Le pachto (ou pachtou) appartient à la famille des langues indo-iranienne. Il est parlé par les Pachtounes, principalement au Pakistan et en Afghanistan.

Ce corpus a été produit par ELDA dans le cadre du projet PEA TRAD, avec le soutien de la Direction Générale de l'Armement (DGA).

MEMBERacademiccommercial
Licence: Non Commercial Use - ELRA END USER
2000.00 € submit
20000.00 € submit
Licence: Commercial Use - ELRA VAR
20000.00 € submit
20000.00 € submit
NON MEMBERacademiccommercial
Licence: Non Commercial Use - ELRA END USER
3500.00 € submit
28000.00 € submit
Licence: Commercial Use - ELRA VAR
28000.00 € submit
28000.00 € submit
06/04/2016
People who looked at this resource also viewed the following:
Resources from the same project