Teil eines Buches,

Neue Verfahrenswege der Wissensorganisation : eine Evaluation automatischer Indexierung in der sozialwissenschaftlichen Fachinformation

.
Theorie, Semantik und Organisation von Wissen: Proceedings der 13. Tagung der Deutschen Sektion der Internationalen Gesellschaft für Wissensorganisation (ISKO) und dem 13. Internationalen Symposium der Informationswissenschaft der Higher Education Association for Information Science (HI) Potsdam (19.-20.03.2013): 'Theory, Information and Organization of Knowledge' / Proceedings der 14. Tagung der Deutschen Sektion der Internationalen Gesellschaft für Wissensorganisation (ISKO) und Natural Language & Information Systems (NLDB) Passau (16.06.2015): 'Lexical Resources for Knowledge Organization' / Proceedings des Workshops der Deutschen Sektion der Internationalen Gesellschaft für Wissensorganisation (ISKO) auf der SEMANTICS Leipzig (1.09.2014): 'Knowledge Organization and Semantic Web' / Proceedings des Workshops der Polnischen und Deutschen Sektion der Internationalen Gesellschaft für Wissensorganisation (ISKO) Cottbus (29.-30.09.2011): 'Economics of Knowledge Production and Organization'. Hrsg. von W. Babik, H.P. Ohly u. K. Weber, 16, Ergon, Würzburg, (2017)

Zusammenfassung

Der vorliegende Artikel präsentiert Evaluationsergebnisse eines automatischen Indexierungsverfah-rens zur Erschließung sozialwissenschaftlicher Forschungsliteratur. Auf der Grundlage des sog. Schalenmodells (Krause 1996, 2006) und des darin formulierten Anwendungsszenarios, wonach als weniger relevant erachtete Datensätze der Literaturdatenbank SOLIS (Sozialwissenschaftliches Literaturinformationssystem) automatisch erschlossen werden sollten, wurde die Indexierungssoft-ware MindServer der Firma Recommind in zwei Testserien getestet. Wurden in der ersten Testserie die allgemeinen Softwareeinstellungen getestet, wurden in der zweiten Testserie die Indexierungser-gebnisse zwischen den Kern- und einem Randbereich der Literaturdatenbank miteinander vergli-chen. Zu diesem Zweck wurden fachteilgebietsspezifische Versionen der Indexierungssoftware aufgebaut, die ausschließlich anhand von Datensätzen der entsprechenden Fachteilgebiete trainiert wurden. Die Ergebnisse der Evaluation, die auf Basis intellektuell generierter Vergleichsdaten vorgenommen wurde, weisen auf Unterschiede in der Indexierungsleistung zwischen Rand- und Kernbereichen der Datenbank hin, die einerseits gegen die Implementierung des automatischen Indexierungsverfahren für die Erschließung der Randbereiche sprechen. Andererseits deutet sich an, dass sich die Indexierungsqualität durch den Aufbau fachteilgebietsspezifischer Trainingsmen-gen verbessern lässt.

Tags

Nutzer

  • @lepsky

Kommentare und Rezensionen