CALEM (Comprehensive Arabic LEMmas)

View resource name in all available languages

CALEM (Lexique complet de lemmes en arabe)

462-532-124-988-8

ID:

ELRA-L0133

Comprehensive Arabic LEMmas is a lexicon covering a large list of Arabic lemmas and their corresponding inflected word forms (stems) with details (POS + Root). Each lexical entry represents a lemma followed by all its possible stems and each stem is enriched by its morphological features, especially the root and the POS. It is composed of 164,845 lemmas representing 7,200,918 stems, detailed as follows: 757 Arabic particles, 2,464,631 verbal stems, 4,735,587 nominal stems. The lexicon is provided as an LMF conformant XML-based file in UTF8 encoding, which represents about 1.22 Gb of data.

View resource description in French

Le lexique CALEM (Comprehensive Arabic LEMmas - Lexique complet de lemmes en arabe) couvre une liste exhaustive de lemmes et leurs formes de mots correspondantes fléchies (radicaux) avec détail (partie du discours et racine). Chaque entrée lexicale représente un lemme suivi par tous les radicaux possibles et chaque radical est enrichi par ses attributs morphologiques, en particulier la racine et la partie du discours. Il comprend 164 845 lemmes représentant 7 200 918 radicaux, distribués comme suit: 757 particules de l’arabe, 2 464 631 radicaux verbaux, 4 735 587 radicaux nominaux. Le lexique est fourni dans un fichier XML conforme à la norme LMF et codé en UTF8, ce qui représente environ 1,22 Go de données.

MEMBERacademiccommercial
Licence: Attribution, Non Commercial Use, No Derivatives - CC-BY-NC-ND
0.00 € submit
0.00 € submit
Licence: Commercial Use - ELRA VAR
5000.00 € submit
5000.00 € submit
NON MEMBERacademiccommercial
Licence: Attribution, Non Commercial Use, No Derivatives - CC-BY-NC-ND
0.00 € submit
0.00 € submit
Licence: Commercial Use - ELRA VAR
7500.00 € submit
7500.00 € submit
03/02/2023
People who looked at this resource also viewed the following: