TRAD Arabic-French Parallel corpus of transcribed Broadcast News Speech

View resource name in all available languages

Corpus TRAD parallèle arabe-français (transcriptions d’actualités télédiffusées)

862-201-329-808-4

ID:

ELRA-W0101

This is a parallel corpus of 10,000 words in Arabic and 4 reference translations in French. The source texts are transcriptions of broadcast news in Arabic recorded on France 24. The translation has been conducted by four different translation teams following a strict protocol aimed at producing high quality translations.

The content is also translated into English (see ELRA-W0102).

This corpus was produced by ELDA within the PEA TRAD project supported by the French Ministry of Defence (DGA). It was used as a test set for the 2012 TRAD MT evaluation campaign.

View resource description in French

Il s’agit d’un corpus parallèle de 10,000 mots en arabe et 4 traductions de référence en français. Les données sources sont constituées de la transcription d’enregistrements d'émissions diffusées en arabe sur France 24. La traduction a été réalisée par quatre équipes de traduction différentes en suivant un protocole rigoureux permettant de produire des traductions de bonne qualité.

Le contenu a également été traduit vers l’anglais (voir ELRA-W0102).

Ce corpus a été produit par ELDA dans le cadre du projet PEA TRAD, avec le soutien de la Direction Générale de l'Armement (DGA). Il a été utilisé en tant que données de test lors de la campagne d’évaluation TRAD 2012.

MEMBERacademiccommercial
Licence: Non Commercial Use - ELRA END USER
150.00 € submit
500.00 € submit
Licence: Commercial Use - ELRA VAR
500.00 € submit
500.00 € submit
NON MEMBERacademiccommercial
Licence: Non Commercial Use - ELRA END USER
300.00 € submit
1000.00 € submit
Licence: Commercial Use - ELRA VAR
1000.00 € submit
1000.00 € submit
14/10/2016
People who looked at this resource also viewed the following:
Resources from the same project