Die im Projekt Digital Plato (www.digital-plato.org) im Rahmen der Förderung durch die VolkswagenStiftung entwickelten Tools zur Paraphrasensuche via WMD sowie komplexen n-Grammen und dem Referenzannotierer ermöglichen eine völlig neue, webbasierte Analyse von Texten.
Die im Projekt Digital Plato (www.digital-plato.org) im Rahmen der Förderung durch die VolkswagenStiftung entwickelten Tools zur Paraphrasensuche via WMD sowie komplexen n-Grammen und dem Referenzannotierer ermöglichen eine völlig neue, webbasierte Analyse von Texten: Mit der rWMD (relaxed Word Mover’s Distance) sind Paraphrasenkandidaten in digitalisierten Textkorpora zu identifizieren, mit dem Referenzannotierer können die Relationen zwischen den so aufgefundenen Textpassagen in verschiedenen Kategorien annotiert werden und mit der auf komplexen n-Grammen basierenden Suche können über eine Variation der Parameter unterschiedliche Paraphrasenbegriffe für die jeweilige Suchanfrage modelliert werden. Alle gefundenen Textzitate werden mit CTS-URNs nach dem Protokoll der Canonical Text Services versehen, um eine persistente Zitierweise zu sichern. Exportmöglichkeiten für die Weiterverarbeitung stehen ebenfalls zur Verfügung.