ICE-GB (British English component of the International Corpus of English)

View resource name in all available languages

ICE-GB (partie britannique du corpus international de l'anglais)

ICE-GB

ID:

ELRA-W0021

ICE-GB is the British component of the International Corpus of English (ICE). ICE began in 1990 with the primary aim of providing material for comparative studies of varieties of English throughout the world. Twenty centres around the world are preparing corpora of their own national or regional variety of English.

ICE-GB is fully grammatically analysed. Like all the ICE corpora, ICE-GB consists of a million words of spoken and written English and adheres to the common corpus design. 200 written and 300 spoken texts make up the million words. Every text is grammatically annotated, allowing complex and detailed searches across the whole corpus.

ICE-GB contains 83,394 parse trees, including 59,640 in the spoken part of the corpus.

ICE-GB has been fully checked. It was checked by linguists at several stages in its completion, using both a traditional 'post-checking' strategy and also by cross-sectional error-based searches.

ICE-GB is distributed with the retrieval software ICECUP (the International Corpus of English Corpus Utility Program). ICECUP supports a variety of query types, including the use of the parse analyses to construct Fuzzy Tree Fragments to search the corpus.

View resource description in all available languages

ICE-GB est la partie britannique du corpus international de l'anglais (ICE - International Corpus of English). ICE a débuté en 1990 avec comme but premier de fournir du matériel pour les études comparatives des différentes variantes de l'anglais à travers le monde. Vingt centres dans le monde ont ainsi préparé des corpus de leur variante nationale ou régionale de l'anglais.

ICE-GB est entièrement analysé d'un point de vue grammatical. Comme tous les corpus ICE, ICE-GB comprend un million de mots de l'anglais oral et écrit et est conforme au concept du corpus commun. 200 textes écrits et 300 textes parlés forment le corpus d'un million de mots. Chaque texte est annoté grammaticalement, permettant des recherches complexes et détaillées à travers tout le corpus.

ICE-GB comprend 83 394 arbres syntaxiques, dont 59 640 pour la partie orale du corpus.

ICE-GB a été vérifié intégralement par des linguistes à différents niveaux de sa réalisation, en procédant non seulement par une stratégie de "post-vérification" traditionnelle et par des recherches croisées basées sur les erreurs.

ICE-GB est distribué avec le logiciel de recherche ICECUP (International Corpus of English Corpus Utility Program ). ICECUP permet différents types de requêtes, dont l'usage d'analyses syntaxiques pour la construction de fragments d'arbre flou permettant la recherche dans le corpus.

You don’t have the permission to edit this resource.