Czech WordNet

View resource name in all available languages

WordNet tchèque

009-714-127-860-1

ID:

ELRA-M0047

The Czech WordNet was developed by the Centre of Natural Language Processing at the Faculty of Informatics, Masaryk University, Czech Republic.

The Czech WordNet captures nouns, verbs, adjectives, and partly adverbs, and contains 28,201 word senses (synsets). Every synset encodes the equivalence relation between several literals (at least one is present), having a unique meaning (specified in the SENSE tag value), belonging to one and the same part of speech (specified in the POS tag value), and expressing the same lexical meaning. Each Czech synset is related to the corresponding synset in the Princeton WordNet 2.0. via its identification number ID. There is at least one language-internal relation (there could be more) between a synset and another synset in the database.

The Czech WordNet is a language-internal structure, minimally containing
• A set of variants or synonyms making up the synset;
• part-of-speech;
• language-internal relations to other synsets;
• a unique-id linking the synset to the Princeton Wordnet 2.0.

It consists of:
• Number of Synsets: 28,201 (+258 Cze)
• Number of Literals: 43,958
• Domain specific synsets:27,897
• Lexico-semantic relations: 34,267
• Extralinguistic relations: 28,201

a) The Czech WordNet is distributed with:
• morpho-syntactic properties – surface and deep verb frames – 824;
• examples accompanying the verb frames.

b) The Czech WordNet is distributed without:
• glosses;
• usage labels;
• examples.

VisDic and DEBVisDic, software tools for browsing and editing WordNet-like databases written in XML format, are accessible from the web addresses: http://nlp.fi.muni.cz/projects/visdic and http://deb.fi.muni.cz/debvisdic, and can be downloaded in the version for MS Windows and Linux. From these pages Princeton WordNet 2.0 can be downloaded in the XML format as well.

View resource description in French

WordNet tchèque a été développé par le Centre de traitement du langage naturel de la Faculté d’informatique de l’Université de Masary, en République Tchèque.

WordNet tchèque présente des noms, des verbes, des adjectifs et (parfois) des adverbes et contient 28 201 sens de mot (synsets). Pour chaque synset a été codée la relation d’équivalence entre plusieurs mots ou expressions, appelés « literals » (dont au moins un est présent dans un synset), avec un sens unique (dont la valeur est indiquée dans l’étiquette SENSE), une appartenance à la même et unique partie du discours (dont la valeur est indiquée dans l’étiquette POS), et avec l’expression du même sens lexical. Chaque synset est mis en relation avec le synset correspondant de la version 2.0 du WordNet anglais par l’intermédiaire de son numéro d’identification ID. Il existe au moins une relation interne à la langue (il peut y en avoir plus) entre deux synsets de la base de données.

WordNet tchèque est une structure interne à la langue, qui contient au minimum:
• un ensemble de variantes ou synonymes formant le synset;
• la partie du discours;
• des relations à d’autres synsets internes à la langue;
• un identifiant unique reliant le synset au WordNet anglais 2.0.

Il comprend:
• Nombre de synsets: 28,201 (+258 Cze)
• Nombre de « literals »: 43,958
• Synsets spécifiques au domaine: 27,897
• Relations lexico-semantiques: 34,267
• Relations extra-linguistiques: 28,201

a) WordNet tchèque est distribué avec:
• des propriétés morpho-syntaxiques – attributs de verbes de surface et de profondeur – 824;
• des exemples accompagnant les attributs verbaux.

b) WordNet tchèque est distribué sans:
• gloses;
• étiquettes d’usage;
• exemples.

VisDic et DEBVisDic, des outils logiciels permettant de naviguer et d’éditer des bases de type WordNet au format XML, sont accessibles depuis les adresses web suivantes : http://nlp.fi.muni.cz/projects/visdic et http://deb.fi.muni.cz/debvisdic, et peuvent être téléchargés en version MS Windows et Linux. A partir de ces pages, le Princeton WordNet 2.0 peut également être téléchargé au format XML.

MEMBERacademiccommercial
Licence: Non Commercial Use - ELRA END USER
250.00 € submit
2000.00 € submit
Licence: Commercial Use - ELRA VAR
3000.00 € submit
3000.00 € submit
NON MEMBERacademiccommercial
Licence: Non Commercial Use - ELRA END USER
475.00 € submit
4000.00 € submit
Licence: Commercial Use - ELRA VAR
6000.00 € submit
6000.00 € submit
11/12/2008
People who looked at this resource also viewed the following: