arbido, die Fachzeitschrift für alle, die in Archiven, Bibliotheken, Dokumentationsstellen und Museen arbeiten, diese besuchen, benutzen oder unterstützen.
Mit einem Projekt im Rahmen der nationalen KI-Strategie untersucht die DNB, welche der vielversprechenden aktuellen Entwicklungen aus den Bereichen des maschinellen Lernens und der natürlichen Sprachverarbeitung sich für die Erschließung textbasierter Medienwerke eignen. Die Gemeinsame Normdatei (GND) mit potentiell 1,3 Millionen Deskriptoren zur Inhaltserschließung stellt für die maschinellen Verfahren dabei ein sehr komplexes Zielvokabular dar und macht das Problem der Beschlagwortung zu einem sog. „Extreme Multi Label Classification“ (XMLC) Problem. Wir wollen skizzieren, welche Implikationen dies für die Anwendung maschineller Verfahren zur Inhaltserschließung mit sich bringt, und welche Lösungen es dazu aktuell gibt.
Die Flut von Dokumenten, die in Wirtschaft und Gesellschaft täglich entsteht, stellt eine enorme Herausforderung dar. Informationen aus zahlreichen unterschiedlichen Quellen müssen sortiert, verarbeitet und bewertet werden. Betroffen davon sind Unternehmen, aber auch Behörden, Forschungseinrichtungen und Krankenhäuser. Das Fraunhofer-Institut für Intelligente Analyse- und Informationssysteme IAIS hat Lösungen entwickelt, die Dokumente aller Art klassifizieren und die Textinhalte erschließen. Den Schlüssel bilden dabei KI-basierte Sprachmodelle, die mit Deep-Learning-Verfahren trainiert werden.
Schöllhorn, Katharina. - Bachelorarbeit HdM. - Normdaten sind nicht nur bibliothekarische Arbeitsmittel, sie bilden auch die Grundlage für unterschiedliche Sucheinstiege in Onlinekatalogen. Mit dieser Rolle beschäftigt sich die vorliegende Arbeit. Im Einführungsteil werden einige Rahmenbedingungen zu Onlinekatalogen und Normdateien erläutert. Die anschließend betrachteten Benutzeranalysen geben nicht nur Einblick in das Rechercheverhalten mit Normdaten, sondern zeigen auch typische Fehlerquellen auf. Im Anschluss daran werden Anwendungsbeispiele vorgestellt, um zu illustrieren, wie sich der Zugang und die Recherche mit Normdaten im Onlinekatalog für Nutzer zurzeit gestalten. Zuletzt werden verschiedene Möglichkeiten und Anwendungen betrachtet, die neue Entwicklungschancen für Normdaten in Onlinekatalogen liefern.
Karen Coyle is in the putting the finishing touches on the February issue of Library Technology Reports, titled "RDA Vocabularies for a Twenty-First-Century Data Environment". In the following excerpt, she addresses the difficulty that many librarians have in understanding the basic concepts of FRBR, and offers some diagrams to clarify them. Though understanding FRBR may be tricky, she argues, it is essential to a transformation to a modern, workable data environment.
This year the ALCTS Forum at ALA MidwinterL1 brought together three perspectives on massaging bibliographic data of various sorts in ways that use MARC, but where MARC is not the end goal. What do you get when you swirl MARC, ONIX, and various other formats of metadata in a big pot? Three projects: ONIX Enrichment at OCLC, the Open Library Project, and Google Book Search metadata.
J. Bertram. Content and Communication Terminology, Language Resources and Semantic Interoperability ERGON Verlag, Würzburg, Band 2 edition, (2005)ISBN 3-89913-442-7.