Greek Textual Entailment Corpus
View resource name in all available languages
Ελληνικό Σώμα Κειμενικής Συνεπαγωγής GTEC
GTEC
GTEC consits of 600 T-H pairs manually annotated for entailment (i.e. whether T entails H or not) by human annotators. The dataset which is tailored to guide training and evaluation of prospect RTE systems, is equally divided in three subsets each one representing the output of a specific HLT application: Question Answering (QA), Comparable Documents (CD) and Machine Translation (MT), and pertaining to specific subject fields (e.g. law, politics, travel). T-H examples that correspond to success and failure cases of the afore-mentioned applications have been included in the corpus. The annotations provided are conformant to the RTE1 and RTE2 challenges.
View resource description in all available languages
Το Ελληνικό Σώμα Κειμενικής Συνεπαγωγής (Greek Textual Entailment Corpus, GTEC) αποτελείται από 600 ζεύγη T-H (κείμενο συνεπαγωγής & συνεπαγώμενη υπόθεση) τα οποία έχουν επισημειωθεί ως προς το αν η πρόταση T συνεπάγεται την πρόταση Η από ανθρώπους επισημειωτές σύμφωνα με το σχήμα επισημείωσης που χρησιμοποιήθηκε στις δοκιμασίες RTE1 & RTE2.
Τα δεδομένα είναι οργανωμένα σε τρεις υποομάδες, οι οποίες αντιστοιχούν σε τρεις εφαρμογές Γλωσσικής Τεχνολογίας (συστημάτα Ερωταποκρίσεων, Συγκρίσιμων Αρχείων και Μηχανικής Μετάφρασης), και ανήκουν σε τρεις γνωστικούς τομείς (νομικά, πολιτική & ταξίδια). Στο σώμα περιλαμβάνονται παραδείγματα επιτυχούς και ανεπιτυχούς συνεπαγωγής.
- ILSP FBT POS tagger
- ILSP-Lemmatizer
- web news
- EU texts
People who looked at this resource also viewed the following: