VERBMOBIL II - VM CD21.1 - VM21.1 (new edition)
View resource name in all available languages
VERBMOBIL II - VM CD 21.1 - VM21.1 (nouvelle édition)
ID:
ELRA-S0034_30
Verbmobil is a long-term project of the German Federal Ministry of Education, Science, Research and Technology (BMBF, Projekträger DLR). Its aim is to give Germany an international top position in language technology and its economical application in the next millenium by cooperation and concentration of as many as possible specialists from industry and science. The long-sighted aim is the development of a mobile translation system for the translation of spontaneous speech in face-to-face situations.The following resources are spontaneous speech databases recorded in a dialogue task (appointment scheduling) .
VERBMOBIL II - VM CD21.1 - VM21.1 (new edition) consists of 1 CD-ROM with 38 spontaneous dialogues (38 close mic, 2 room mic, 22 phone line (GSM)), 2331 turns, transliteration (VM II format), NIST headers, partitur files (files describing the different parts which constitute the corpus - word order, phrase order, etc. ) in German.
View resource description in all available languages
Verbmobil est un projet du Ministère fédéral allemand de l'Education, des Sciences, de la Recherche et des Technologies (BMBF, Projekträger DLR), qui vise à placer l'Allemagne en position de force dans le domaine de l'ingénierie de la langue. Son objectif , à long terme, est de développer un système de traduction vocale automatique, pour la traduction de conversations spontanées.
Ces ressources sont des enregistrements de conversation pour la prise de rendez-vous. Le corpus allemand comprend 13 910 occurrences (échanges). L'édition de BAS de la partie allemande est entièrement étiquetée et segmentée en unités phonémiques/phonétiques (alphabet SAM-PA) par le système MAUS et partiellement segmentée de manière manuelle.
VERBMOBIL II - VM CD 21.1 - VM21.1 (nouvelle édition) contient 1 CD-ROM composé de 38 dialogues spontanés (38 dialogues enregistrés avec un micro-casque très près de la bouche, 2 avec un microphone situé dans la pièce, 22 enregistrés à travers le réseau téléphonique (GSM)), 2331 échanges, transcription (format VM II), en-têtes NIST, fichiers partitur (fichiers décrivant les différentes parties constituant le corpus (ordre des mots, ordre des phrases, etc.)) en allemand.
People who looked at this resource also viewed the following: