TRAD Arabic-English Parallel corpus of transcribed Broadcast News Speech

View resource name in all available languages

Corpus TRAD parallèle arabe-anglais (transcriptions d’actualités télédiffusées)

ID:

ELRA-W0102

This is a parallel corpus of 10,000 words in Arabic and 2 reference translations in English. The source texts are transcriptions of broadcast news in Arabic recorded on France 24. The translation has been conducted by two different translation teams following a strict protocol aimed at producing high quality translations.

The content is also translated into French (see ELRA-W0101).

This corpus was produced by ELDA within the PEA TRAD project supported by the French Ministry of Defence (DGA). It was used as a test set for an internal evaluation campaign.

View resource description in all available languages

Il s’agit d’un corpus parallèle de 10,000 mots en arabe et 2 traductions de référence en anglais. Les données sources sont constituées de la transcription d’enregistrements d'émissions diffusées en arabe sur France 24. La traduction a été réalisée par deux équipes de traduction différentes en suivant un protocole rigoureux permettant de produire des traductions de bonne qualité.

Le contenu a également été traduit vers le français (voir ELRA-W0101).

Ce corpus a été produit par ELDA dans le cadre du projet PEA TRAD, avec le soutien de la Direction Générale de l'Armement (DGA). Il a été utilisé en tant que données de test lors d’une campagne d’évaluation de la traduction automatique interne au projet.

You don’t have the permission to edit this resource.
People who looked at this resource also viewed the following:
Resources from the same project