TRAD Pashto-English News Articles Parallel corpus

Corpus TRAD parallèle pachto-anglais (textes journalistiques)




This is a parallel corpus, which contains 10,000 Pashto words translated into English by two different translators. The source texts have been collected from the following news websites: Azadiradio, Mashaal and Voice of America Pashto.

The content has also been translated into French (see ELRA-W0096 TRAD Pashto-French Newspaper Parallel corpus)

Pashto is an indo-iranian language spoken by the Pashtun people mainly in Pakistan and Afghanistan.

This corpus was produced by ELDA within the PEA TRAD project supported by the French Ministry of Defence (DGA).

Il s’agit d’un corpus parallèle pachto-anglais. Il contient 10 000 mots en pachto traduits en anglais par deux traducteurs différents. Les textes sources correspondent à 9 articles de presse provenant des sites d’information Azadiradio, Mashaal et Voice of America Pashto.

Le contenu a également été traduit en français (voir W0096 Corpus TRAD parallèle pachto-français - textes journalistiques).

Le pachto (ou pachtou) appartient à la famille des langues indo-iranienne. Il est parlé par les Pachtounes, principalement au Pakistan et en Afghanistan.

Ce corpus a été produit par ELDA dans le cadre du projet PEA TRAD, avec le soutien de la Direction Générale de l'Armement (DGA).

