seems like it must be viewed with a webkit browser like epiphany or chrome
bla1
bla2
bla3
bla4
bla5
bla6
bla7
bla8
bla9
bla10
bla11
bla12
bla13
bla14
bla15
bla16
bla17
«Traditionally, unification grammars are hand-coded. This is extremely time consuming, expensive and very difficult to scale. [...] we have developed a new method for automatically extracting wide-coverage probabilistic unification (LFG) grammars from treebank resources. To achieve this, we first automatically annotate the treebank (such as Penn-II) with feature-structure information (LFG f-structures, approximating to basic predicate-argument structure). From the f-structure annotated treebank, we then automatically extract wide-coverage, probabilistic LFG approximations to parse new text»
Die Tübinger Baumbank des Deutschen / Schriftsprache (TüBa-D/Z) ist ein syntaktisch annotiertes Korpus auf der Grundlage der Zeitung "die tageszeitung" (taz). Sie umfasst zur Zeit ca. 36 000 Sätze bzw. 630 000 Worte.
Das NEGRA Korpus Version 2 besteht aus 355.096 Tokens (20.602 Sätzen) deutschen Zeitungstextes aus der Frankfurter Rundschau. Die Texte sind der CD "Multilingual Corpus 1" der European Corpus Initiative entnommen. Es basiert auf ca. 60.000 Tokens, die am Institut für maschinelle Sprachverarbeitung, Stuttgart, mit Parts-of-Speech annotiert wurden. Dieses Korpus wurde erweitert, ebenfalls mit Parts-of-Speech versehen und vollständig mit syntaktischen Strukturen annotiert. Der Aufbau des Korpus wurde in den Projekten NEGRA (DFG Sonderforschungsbereich 378, Projekt C3) und LINC (Universität des Saarlandes) in Saarbrücken durchgeführt.
A. Søgaard. Proceedings of the 2020 Conference on Empirical Methods in Natural Language Processing (EMNLP), Seite 2765--2770. Online, Association for Computational Linguistics, (November 2020)
M. Volk, T. Marek, und Y. Samuelsson. Proceedings of the Workshop on Human Judgements in Computational Linguistics, Seite 51--57. Manchester, Association for Computational Linguistics, Association for Computational Linguistics, (2008)
H. Dyvik, P. Meurer, V. Rosén, und K. De Smedt. Proceedings of the Eighth International Workshop on Treebanks and Linguistic Theories, Seite 71--82. Milano, EDUCatt, (2009)
J. Tiedemann, und G. Kotzé. Proceedings of the Workshop on Natural Language Processing Methods and Corpora in Translation, Lexicography, and Language Learning, Seite 33--39. Borovets, Bulgaria, Association for Computational Linguistics, Association for Computational Linguistics, (2009)
V. Zhechev, und A. Way. Proceedings of the 22nd International Conference on Computational Linguistics, 1, Seite 1105--1112. Manchester, Association for Computational Linguistics, Association for Computational Linguistics, (2008)
V. Rosén, und K. De Smedt. Proceedings of the 16th Nordic Conference of Computational Linguistics NODALIDA-2007, Seite 152--159. Tartu, University of Tartu, (2007)
M. Hearne, S. Ozdowska, und J. Tinsley. Actes de la 15e Conférence Annuelle sur le Traitement Automatique des Langues Naturelles (TALN '08), Avignon, France, ATALA, (2008)
Y. Samuelsson, und M. Volk. Treebanking for Discourse and Speech. Proceedings of the NODALIDA 2005 Special Session on Treebanks for Spoken Language and Discourse, Volume 32 von Copenhagen Studies in Language, Seite 147. Forlaget Samfundslitteratur, København, (2005)
P. Cimiano, und J. Völker. Proceedings of the 10th International Conference on Applications of Natural Language to Information Systems (NLDB), Volume 3513 von Lecture Notes in Computer Science, Seite 227-238. Alicante, Spain, Springer, (Juni 2005)
V. Rosén, P. Meurer, und K. de Smedt. Proceedings of the 7th International Workshop on Treebanks and Linguistic Theories (TLT7), Seite 127--133. Utrecht, LOT, (2009)