German Political Speeches Corpus
View resource name in all available languages
Corpus de discours politiques en allemand
ID:
ELRA-W0330
This corpus consists of a collection of political speeches in German crawled from the online archive of the German presidency (Bundespraësident) and the Chancellery (Bundesregierung).
For the German Presidency the speeches are available from July 1, 1984 to February 17, 2012 and the corpus contains a total of 1,442 texts comprising 2,392,074 tokens.
For the German Chancellery, the corpus contains a total of 1,831 texts comprising 3,891,588 tokens covering a period from December 11, 1998 to December 6, 2011. This corpus contains speeches from the Chancellor but also from other politicians.
The corpus is released in XML and Unicode format, the files have their own DTD, inspired by TEI guidelines. Tokenisation, POS-Tags and Lemmas are included.
View resource description in
French
Le corpus de discours politiques en allemand a été collecté à partir des archives en ligne de la Présidence allemande (Bundespraësident) et de la Chancellerie (Bundesregierung).
Concernant la Présidence allemande, les discours sont disponibles du 1er Juin 1984 au 17 Février 2012 et le corpus contient un total de 1442 textes contenant 2 392 074 tokens.
Concernant la Chancellerie, le corpus contient un total de de 1831 textes comprenant 3 891 588 tokens couvrant la période du 11 D2cembre 1998 au 6 Décembre 2011. Pour information ce corpus contient des discours du Chancelier ainsi que d’autres politiciens.
Ce corpus est mis à disposition au format XML et Unicode, les fichiers ont leurs propres DTD inspirés par les lignes directrices TEI. La Tokenisation, les étiquettes de Part Of Speeches and des Lemmes sont inclus.
MEMBER | academic | commercial |
---|---|---|
Licence: Attribution, Share Alike - CC-BY-SA |
0.00 €
|
0.00 €
|
NON MEMBER | academic | commercial |
---|---|---|
Licence: Attribution, Share Alike - CC-BY-SA |
0.00 €
|
0.00 €
|