“In LOD we trust” – Ein Bericht von der SWIB13

Wie die Zeit vergeht … Ich habe es endlich geschafft, auch meine Eindrücke von der SWIB 13 in Worte zu fassen. Viel Spaß damit!

In diesem Im letzten Jahr feierte die Konferenz “Semantic Web in Bibliotheken” – kurz SWIB – in Hamburg ihren fünften Geburtstag. ((Website; Twitterarchiv))
Ich hatte für mich den Schwerpunkt auf die Bereiche Datenanalyse, Linking und Distribution gelegt, da es für mich jetzt, nach der Zeit der Datenmodellierung, in die Phase der konkreten Datenerzeugung und Veröffentlichung geht.

Vorkonferenz/Workshops:
Schon bei der Anmeldung zur SWIB hatte ich die schwere Entscheidung zu treffen, welchen Workshop ich besuchen soll. Zum einen waren da die beiden Workshops zur Datenanalyse und -aufbereitung mittels Catmandu ((Webseite des LibreCat-Projekts inkl. Backbone Catmandu)) bzw. MetaFacture, deren Verwendung unsere Datenqualität erheblich verbessern könnten. Zum anderen war da der Workshop zum Thema Provanance Metadata, dessen Inhalte für die Publikation und Verwendung von Linked Data relevant sind.
Entschieden habe ich mich letztlich für den Workshop zu “Analysis of Library Metadata with Metafacture” von Christoph Böhme, da die Datenanalyse und -aufbereitung der nächste notwendige Schritt vor der Veröffentlichung der Daten darstellt. Für MetaFacture habe ich mich entschieden, weil das Tool zum einen im Projekt lobid.org des hbz und zum anderen von CultureGraph verwendet wird und beide Projekte bzw. Plattformen für uns als UB Dortmund eine gewisse Relevanz haben.

MetaFacture ist ein Tool zur Analyse und Aufbereitung von Metadaten. Entwickelt wurde das Tool im Rahmen des Projekts “CultureGraph” und setzt auf Einfachheit in der Anwendung. Es besteht dabei aus zwei Komponenten: Flux und Metamorph.
Die Idee des Werkzeugs ist, dass Daten durch sogenannte Pipes geleitet werden, dessen Module für kleine Aufgaben zuständig sind.
Das folgende Beispiel einer Flux-Datei illustriert diese Idee:

"in-file"
|open-file
|decode-pica
|morph("morph.xml")
|encode-json
|write("out-file");

Im Schritt morph wird die eigentliche Arbeit an den Daten definiert. Dazu dient eine XML-Datei, die mittels einfacher Befehle Daten manipulieren kann.

<?xml version="1.0" encoding="UTF-8"?>
 <metamorph xmlns="http://www.culturegraph.org/metamorph"
  xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" 
  version="1" entityMarker=".">	
  <rules>
    <combine name="" value="${ID}, ${Lastname}, ${Firstname}, ${Birthdate}, ${Birthplace}" flushWith="record">
      <data source="_id" name="ID" />
      <data source="Firstname" />
      <data source="Lastname" />
      <data source="Birthdate" />
      <data source="Birthplace" />
    </combine>
  </rules>	
 </metamorph>

MetaFacture liefert schon ein paar Decoder und Encoder mit, sodass beispielsweise MARC-Daten einfach in Triples umgewandelt werden können.

Der Workshop hatte diese Bezeichnung wirklich verdient. Es wurde in kurzen und mit jeder Einheit inhaltlich anspruchsvolleren Abschnitten die Funktionsweise erläutert. Zwischen den Theorieabschnitten war sehr viel Zeit für praktische Übungen. Der Workshop kann daher nur als gelungen bewertet werden.

“Bringing People to Linked Data”
Der erste Tag der Hauptkonferenz startete mit einer ausgezeichneten Keynote von Dorothea Salo ((@LibSkrat, zur Person, Abstract)).
Sie thematisierte in ihrem sehr unterhaltsamen Vortrag “Soylent SemWeb Is People! Bringing People to Linked Data” das Verhältnis zwischen Bibliothekaren und Linked Data insbesondere aus Sicht der Ausbildung. Sie kam dabei zu dem Schluss, dass für die Akzeptanz von Linked Data in Bibliotheken dringend Anwendungen entwickelt werden müssen, um den Bibliothkaren aber auch den Entscheidern das Thema näher zubringen und die Vorteile aufzuzeigen (dies gilt insbesondere für öffentliche und “One-Person”-Bibliotheken ((In öffentlichen, Museums- oder Archiv-Bibliotheken und in OPLs sind häufig sogar MARC und MAB zu “oversized”. Gerade hier kann mit neuen Systemen auf Linked Data-Basis viel erreicht werden. Der Vortrag “The ‘OpenCat’ Prototype: Linking Public Libraries to National Datasets” von Agnès Simon (Bibliothèque nationale de France) stellte auch genau diese Gruppe von Bibliotheken in den Fokus.))). Es ist für Linked Data nicht sonderlich förderlich, wenn hier die gleichen Fehler wie bei der Einführung von XML oder Institutional Repositories gemacht werden. Es wurde in ihrer Keynote nochmals sehr deutlich, dass die Sicht der Anwender der neuen Tools essentiell für den Erfolg der Produkte sind. ((Als Beispiele nannte Salo, dass Institutional Repositories ohne die Wissenschaftler entwickelt und monierte, dass bisher Linked Data ohne die Bibliothekare stattfand, die die Daten letztlich erzeugen müssen bzw. sollten.))
In ihren Ausführungen legte Salo den Fokus bei Linked Data ganz deutlich auf die Generierung neuer Daten und nicht nur auf die Veröffentlichung von Altdaten als Linked Data.
Dorothea Salo hat es mit Ihrer Keynote geschafft, dass das folgende Progeamm der SWIB immer wieder auf dieses Forderung bezug genommen hat, wobei sich deutlich gezeigt hat, dass die geforderte Richtung bereits eingeschlagen wurde.

“From Cataloging to Catalinking”
In seinem Vortrag “Linked Data for Libraries: Great Progress, but What Is the Benefit?” betrachtete Richard Wallis (OCLC) ((@rjw, zur Person, Abstract)) das Bibliotheksnutzerverhalten und stellte fest, dass Linked Data den Bibliotheken hilft, die Nutzerinnen und Nutzer dort zu erreichen, wo sie ihr Bedürfnis nach Informationen (zu) stillen (versuchen). Er stellte unter anderem die Frage, wie nach einem Wikipedia-Artikel gesucht wird. Nicht sonderlich überraschend ist die Antwort:

“Ich geben meinen Suchbegriff in Google ein und ergänze um den Begriff ‘wikipedia’. Der erste Treffer ist dann das Gesuchte.”

Wenn man sich diese Aussage durch den Kopf gehen lässt, stellt man fest, dass die aktuellen Entwicklungen in den Bibliotheken rund um die Discovery Systeme nicht zukunftsweisend sind. Die Discovery Systeme in der heutigen Form sind somit maximal eine alternativlose Brückentechnologie auf dem Weg der Bibliotheken ins Web. Um so wichtiger ist die Aufgabe von Bibliotheken bzw. Bibliothearinnen und Bibliothekaren die releveanten Daten als Linked Open Data für das Semantic Web bereitzustellen, also “From Cataloging to Catalinking”.
Wallis stellte in diesem Zusammenhang die “schema.org”-Initiative ((schema.org)) vor, in der sich mittlerweise ein Untergruppe mit der Darstellung von bibliographischen Informationen beschäftigt. ((W3C Schema Bib Extend Community Group))
Die Frage nach einer möglichen Kollision mit der BIBFRAME-Initiative beantwortete Wallis mit der Feststellung, dass im Linked Data-Kontext verschiedene Modelle miteinander kollaborieren und nicht konkurieren.

Die aktuellen Entwicklungen rund um BIBFRAME wurden in der folgenden Session von Lars G. Svensson vorgestellt. ((Abstract))

“Decentralisation, Distribution, Disintegration”
Mit der Sicht von Richard Wallis auf bibliographische Daten ist klar, dass Linked Data ein dezentralisiertes System ist und somit eher “small data” als “big data”. Auch Martin Malmsten stellte in seinem Beitrag “Decentralisation, Distribution, Disintegration – towards Linked Data as a First Class Citizen in Libraryland” diesen Ansatz in den Vordergrund.

Martin Malmsten @ SWIB13

Martin Malmsten @ SWIB13

“In LOD we trust”
Der Workshop zum Thema Provanance Metadata wurde nun schon zum zweiten Mal bei der SWIB angeboten. Während der SWIB zeigte sich in vielen Bereichen, dass die Ebene der Vertrauenswürdigkeit im “Semantic Web Layer Cake” immer mehr in den Fokus rückt.

Semantic Web Layer Cake (w3c)

Semantic Web Layer Cake (w3c)

Die beiden letztgenannten Beiträge zusammengefasst ergeben somit die Erkenntnis, dass unter der Tatsache “Linked Data = Small Data” die Bereitstellung von “Provenance Metadata” eine notwendige Bedingung für “Trust” in der Linked Open Data Cloud und im Semantic Web ist.

Fazit
Die Konferenz war super 🙂 Die Entwicklung von einer lokalen zu einer internationalen Konferenz zeigt, wie wichtig das Thema “Semantic Web” bzw. “Linked Data” in Bibliotheken ist und das die Bibliothekswelt eine entscheidene Rolle darin spielt.

Um Entscheider und Bibliothekare für das Thema zu begeistern sind dringend konkrete Anwendungen notwendig, die die Vorteile näher bringen und nicht auf RDF-Level agieren. Allerdings handelt es sich hierbei um ein Henne-Ei-Problem: es müssen erst Modelle und Daten erzeugt werden, um erste Anwendungen zeigen zu können; es werden aber nur Ressourcen dazu geschaffen, wenn man zeigen kann, warum Linked Data wichtig und nützlich ist.

Martin Malmsten @ SWIB13

Martin Malmsten @ SWIB13

Es kann den Teilnehmern der Tagung und anderen Kolleginnen und Kollegen nicht hoch genug angerechnet werden, dass sie mit soviel Engagement und ohne große Ressourcen die Vorarbeiten leisten.

Weitere lesenswerte Tagungsberichte:

Bestandsnachweise von Bibliotheken als Linked Data

English Version English Version

Lukas Koster formulierte in seinem Blog-Beitrag “Local library data in the new global framework” sehr treffend:

It doesn’t really make sense if all libraries in the world publish identical metadata side by side, does it?
In essence only really unique data is worth publishing. You link to the rest.

Unter den wenigen Beispielen, in denen typische Bibliotheken unikale (Meta-)Daten als Linked Open Data veröffentlichen können, sind spezielle
Sammlungen und auch die immer wichtiger werdenden Forschungsinformationen wissenschaftlicher Einrichtungen. Eine wichtige Datenmenge, die alle Bibliotheken gemeinsam haben, ist aber tatsächlich die der Bestandsnachweise.
In Zeiten, in denen bibliographische Informationen direkt von den Verlagen in die Suchmaschinen des WWW wandern, sind die Bestandsnachweise als Quelle für vernetzte und insbesondere auch mobile Anwendungen interessantes Material.
So wundert es nicht, dass es mittlerweile mehrere Ansätze für die Beschreibung der Bestände gibt. Genannt seien hier:

Betrachtet man u.a. die bisherigen Beiträge dieses Blogs, so wurde die Flexibilität und Aussagekraft von CRM, FRBRoo und PRESSoo bereits bewiesen. Diese Beiträge haben sich bisher weitestgehend auf die Beschreibung von bibliographischen Objekten und Konzepten bezogen, wobei der Bereich des Bestandsnachweises nur kurz angerissen wurde.

Aber auch mit den Ontologien des CRM-Universums in Verbindung mit den Konzepten rund um DAIA können die Bestandsnachweise sehr gut beschrieben werden.

WEM + I im CIDOC CRM-Universum
Am Beispiel des Katalogs der UB Dortmund und des “hbz-Verbundkatalogs” ((Der Katalog des Bibliotheksverbunds NRW wird vom
Hochschulbibliothekszentrum NRW (hbz) betrieben und entsteht durch eine gemeinsame Katalogisierung der Verbundbibliotheken in ein zentrales
Bibliothekssystem (ILS). Die in diesem System erfassten Daten werden anschließend in den Lokalsystemen repliziert.)) soll zunächst gezeigt werden, wie eine zentrale Stelle identische Metadaten verschiedener Quellen — hier also konkret die Bereiche Work, Expression, Manifestation (WEM) — als Linked Data publizieren kann und die unikalen Metadaten der Items (I) durch die Lokalsysteme publiziert werden können.
Das folgende Diagramm stellt die Verlinkung der beiden Metabereiche dar. Dabei beschränkt es sich auf die wesentlichen Komponenten und setzt die Modelle aus FRBRoo — eine Anwendung voraus.

Verbund-Lokal-System

Das obige Diagramm zeigt auf der Seite der tatsächlichen Bestände nur das Konzept der F5 Item aus FRBRoo. Mit dem Erscheinen von PRESSoo gibt es auch für die Bestände von Zeitschriften ein geeignetes “Item”, nämlich Z9 Storage Unit. Auch für digitale Objekte gibt es mit der CRM-Erweiterung CRMdig eine geeignete Darstellung auf Exemplarebene.

Bestandsnachweise
Um nun die Bestandsnachweise mit dem CRM zu beschreiben, macht man sich die Eigenschaften der Eltern-Entitäten der Exemplar-Entitäten zu nutze. Es gilt:

  • F5 Item subClassOf E84 Information Carrier subClassOf E22 Man-Made Object
  • Z9 Storage Unit subClassOf E22 Man-Made Object
  • D13 Digital Information Carrier subClassOf E84 Information Carrier subClassOf E22 Man-Made Object
  • E22 Man-Made Object subClassOf E19 Physical Object subClassOf E18 Physical Thing

Üblicherweise werden solche physischen Dinge an bestimtmen Orten aufbewahrt und gegebenenfalls zugänglich gemacht. Die Aufbewahrungsorte können mit dem CRM-Konzept E27 Site beschrieben werden. Im CRM heißt es dazu:

In contrast to the purely geometric notion of E53 Place, this class describes constellations of
matter on the surface of the Earth or other celestial body, which can be represented by
photographs, paintings and maps.

Somit können Aufbewahrungsorte wie Zweigstellen, Sektionen, Abteilungen oder Magazine über E27 Site Aussagen über Zusammenhänge und Eigentumsverhältnissen zugeordnet werden. Dazu werden folgende Relationen des CRM verwendet (E27 Site subClassOf E18 Physical Thing):

  • E18 Physical Thing P46 is composed of (forms part of) E18 Physical Thing
  • E18 Physical Thing P52 has current owner (is current owner of) E39 Actor
  • E18 Physical Thing P58 has section definition (defines section) E46 Section Definition

Bestandsnachweis

Beispiel 1: The FRBR family of conceptual models

<http://data.ub.tu-dortmund.de/resource/item/20129967> [
  a frbroo:F5_Item ;
  rdfs:label "A 12726" ;
  ecrm:P52_has_current_owner <http://lobid.org/organisation/DE-290> ;				
  ecrm:P46i_forms_part_of [
	a ecrm:E27_Site ;
	ecrm:P58_has_section_definition [
		a ecrm:E46_Section_Definition ;
		rdfs:label "Second Floor"
	]  ;
	ecrm:P46i_forms_part_of [
		a ecrm:E27_Site ;
		ecrm:P58_has_section_definition [
			a ecrm:E46_Section_Definition ;
			rdfs:label "Central Library"
		] ;
		ecrm:P46i_forms_part_of [
		  a ecrm:E27_Site ;
		  ecrm:P58_has_section_definition [
			a ecrm:E46_Section_Definition ;
			rdfs:label "TU Dortmund, University Library"
		  ] ;
		] ;
	] ;
  ] ;  
] .

Das RDF beschreibt das Exemplar mit der Signatur “A 12726”, welches sich in der Zentralbibliothek der Universitätsbibliothek der TU Dortmund im zweiten Obergeschoß befindet. Die Beschreibung der Zentralbibliothek könnte beispielsweise noch um “Geoinformationen” ergänzt werden, da es sich um einen von acht Standorten der gesamten Universitätsbibliothek handelt. Diese “Geoinformationen” sind dann ein mit P53 has former or current location verknüpfter E53 Place.

Bei fortlaufenden Sammelwerken (F18 Serial Work) bzw. beim Spezialfall der Zeitschriften muss man zunächst die Praxis der Aufbewahrung betrachten. Die Exemplare von Zeitschriftenheften liegen — abgesehen von den aktuellsten Heften – meist als Reihe neu gebundener Einheiten vor. Diese Reihen sind in der Regel nicht näher spezifiziert, besitzen allerdings eine gemeinsame Signatur. ((Bei “einfachen” Reihen oder Serien handelt es sich bei den Bänden in der Regel um Objekte in “klassischer Buchform”, die nicht in regelmäßigen Abständen zu neuen Einheiten gebunden werden. Sie werden daher aus dieser Betrachtung herausgelassen.))
Das nachstehende Diagramm zeigt, neben einem aktuellen Heft in Originalbindung, insbesondere das Ergebnis des Bindeprozesses und den Zusammenhang zur Z9 Storage Unit.
Durch die Transformation der Exemplare zu einem neuen Objekt, wird letzteres zu einem Exemplar eines neuen kumulativen Publication Work. Dieses Publication Work ist dabei ein Teil eines neuen fortlaufenden Sammelwerks in Form einer Reihe.

Items_of_Serial_Works

Der Beschreibung der Bestände verteilt sich jetzt auf zwei Objekte:

Im folgenden Beispiel wird der Bestandsnachweis einer Zeitschrift anhand eines Teils ihrer Z9 Storage Unit gezeigt, wobei die Chronology nicht mit aufgeführt wird.

Beispiel 2: Bibliotheksdienst
Diese Zeitschrift hat nach obigem Modell zwei Z9 Storage Unit, da Sie in zwei Standorten der Universitätsbibliothek Dortmund angeschafft wurde.

<http://data.ub.tu-dortmund.de/resource/storageunit/ZA_377> [
  a pressoo:Z9_Storage_Unit ;
  rdfs:label "ZA 377" ;
  ecrm:P52_has_current_owner <http://lobid.org/organisation/DE-290> ;	
  ecrm:P46I_forms_part_of [
	a ecrm:E27_Site ;
	ecrm:P58_has_section_definition [
		a ecrm:E46_Section_Definition ;
		rdfs:label "Basement Level 1"
	]  ;
	ecrm:P46I_forms_part_of [
		a ecrm:E27_Site ;
		ecrm:P58_has_section_definition [
			a ecrm:E46_Section_Definition ;
			rdfs:label "Central Library"
		] ;
		ecrm:P46I_forms_part_of [
		  a ecrm:E27_Site ;
		  ecrm:P58_has_section_definition [
			a ecrm:E46_Section_Definition ;
			rdfs:label "TU Dortmund, University Library"
		  ] ;
		] ;
	] ;
  ] ;  
] . 

<http://data.ub.tu-dortmund.de/resource/storageunit/Bibliotheksdienst> [
  a pressoo:Z9_Storage_Unit ;
  rdfs:label "Bibliotheksdienst" ;
  ecrm:P52_has_current_owner <http://lobid.org/organisation/DE-290> ;				
  ecrm:P46I_forms_part_of [
	a ecrm:E27_Site ;
	ecrm:P58_has_section_definition [
		a ecrm:E46_Section_Definition ;
		rdfs:label "R. 501"
	]  ;
	ecrm:P46I_forms_part_of [
		a ecrm:E27_Site ;
		ecrm:P58_has_section_definition [
			a ecrm:E46_Section_Definition ;
			rdfs:label "Bibl. Sozialforschungsstelle"
		] ;
		ecrm:P46I_forms_part_of [
		  a ecrm:E27_Site ;
		  ecrm:P58_has_section_definition [
			a ecrm:E46_Section_Definition ;
			rdfs:label "TU Dortmund, University Library"
		  ] ;
		] ;
	] ;
  ] ;  
] .

Services für die Exemplare
Bestandsnachweise sind eigentlich ohne die Angabe damit verbundener Dienste der Einrichtung in der Linked Open Data Cloud nicht viel wert. Erst durch die mit den Exemplaren verbundenen Services, wie beispielsweise der Ausleihmöglichkeit, werden Mehrwerte angeboten, die durch die bibliographische Beschreibung allein nicht darstellbar sind.

Wie schon im vorigen Beitrag bemerkt, entwickeln sich aktuell im deutschen Bibliothekswesen einige Mikroontologien rund um die Darstellung von Bibliotheksservices und bibliographischen Metadaten im Linked Data Kontext. Um die mit den tatsächlichen Beständen verbundenen Services und Status zu beschreiben, können die in diesem Rahmen entwickelten Ontologien DAIA, DSO und SSSO verwendet werden.

Das folgende Diagramm zeigt die Anbindung der Document Service Ontology an die Z9 Storage Unit mittels DAIA. Hierbei wird vorausgesetzt, dass der Document-Begriff in DSO und in DAIA auch Z9 Storage Unit berücksichtigt ((In der Spezifikation zu DSO heißt es: “The set of documents is not limited to a specific class[…]”. Daher ist hier die Annahme berechtigt. Bei DAIA müsste die Spezifikation dahingehend erweitert werden, da hier nur frbr:items verwendet werden.))

Z9-DAIA

Die zugeordneten Document Services werden mit der Simple Service Status Ontology beschreiben. Somit sind dann Aussagen wie “Das Exemplar A ist bis zum Datum X nicht ausleihbar.” möglich.

Beispiel 3: ausleihbares Exemplar mittels daia:availableFor

<http://data.ub.tu-dortmund.de/resource/item/20129967> [
  a frbroo:F5_Item ;
  rdfs:label "A 12726" ;
  daia:availableFor [
    a dso:Loan ;
  ] ;
  ecrm:P52_has_current_owner <http://lobid.org/organisation/DE-290> ;				
  ecrm:P46I_forms_part_of [
	a ecrm:E27_Site ;
	ecrm:P58_has_section_definition [
		a ecrm:E46_Section_Definition ;
		rdfs:label "Second Floor"
	]  ;
        ...
  ] ;  
] .

Beispiel 4: Zeitschriftenbestand für die Präsenznutzung und Fernleihe

<http://data.ub.tu-dortmund.de/resource/storageunit/ZA_377> [
  a pressoo:Z9_Storage_Unit ;
  rdfs:label "ZA 377" ;
  daia:unavailableFor [
    a dso:Loan ;
  ] ;
  daia:availableFor [
    a dso:Presenation ;
  ] ;
  daia:availableFor [
    a dso:Interloan;
  ] ;
  ecrm:P52_has_current_owner <http://lobid.org/organisation/DE-290> ;	
  ecrm:P46I_forms_part_of [
	a ecrm:E27_Site ;
	ecrm:P58_has_section_definition [
		a ecrm:E46_Section_Definition ;
		rdfs:label "Basement Level 1"
	]  ;
        ...
  ] ;  
] .

Fazit
Es konnte gezeigt werden, dass ohne ein neues Vokabular und mit bereits bestehenden Ontologien ausgereifte Aussagen über Bestände gemacht werden können.
Übrigens ließen sich auch Erwerbungsinformationen durch die Modell-Familie des CIDOC CRM beschreiben. Als einfachste Variante nehme man für das Erwerbungsereignis das Konzept E8 Acquisition Event und beschreibe es mittels EDIFACT-Daten als E31 Document.

PRESSoo und ECPO – Zwei weitere Ontologien zur Beschreibung von fortlaufenden Sammelwerken

Die Modellierung von fortlaufenden Sammelwerken mittels des Referenzmodells FRBR gestaltet sich schwierig. Als Gründe seien vor allem die Unvollständigkeit von fortlaufenden Sammelwerken und die Heterogenität der in fortlaufenden Sammelwerken enthaltenen Manifestationen genannt.

Unvollständigkeit von fortlaufenden Sammelwerken
In den FRBR ist festgelegt, dass eine Manifestation in dem Sinn abgeschlossen sein muss, dass man ein Exemplar kaufen und ins Regal stellen kann. Bei fortlaufenden Sammelwerken ist das nicht möglich, solange es weitere Hefte und Jahrgänge im Fall von Zeitschriften oder Bände im Fall von Reihen oder Serien gibt.

Heterogenität der in fortlaufenden Sammelwerken enthaltenen Manifestationen
Teile einer Buchreihe können in einer weiteren Auflage in einer anderen Reihe oder selbständig veröffentlicht werden; Zeitschriftenhefte können als Themenhefte wiederum als Buch veröffentlicht werden.

Denkt man die Werke eher vom Inhalt und weniger von der physikalischen Erscheinungsform, so lassen sich diese Probleme in der bibliographischen Beschreibung umgehen. Mittels FRBRoo ist genau dieser Ansatz möglich (siehe z.B. in FRBRoo — eine Anwendung oder FRBR, Serials und CIDOC CRM).

Fortlaufende Sammelwerke und insbesondere Zeitschriften sind allerdings noch wesentlich komplexer in der bibliographischen Beschreibung, da auch historische Zusammenhänge erfasst werden müssen. Zwar lassen sich diese Informationen auch mit FRBRoo modellieren, jedoch nur sehr abstrakt und umständlich.

PRESSoo
Im März 2013 ist nahezu unbemerkt eine erste Version einer Erweiterung der FRBRoo für fortlaufende Sammelwerke erschienen. Die Erweiterung nennt sich PRESSoo (Version 0.1) und betrachtet neben einer groben Darstellung der Zusammenhänge der bibliographischen Einheiten insbesondere die Veränderungen im Laufe des Lebens eines solchen Werkes.

Dadurch lassen sich folgende Transformationen modellieren:

  • Fortsetzungen (z.B. Titeländerungen)
  • Ersetzungen (Fortsetzung mit neuer Erscheinungsweise)
  • Aufgehen eines fortlaufendes Sammelwerks in ein anderes
  • Abspalten eines Teils zu einem neuen fortlaufenden Sammelwerk
  • Zusammenführen von mehreren fortlaufenden Sammelwerken
  • Aufteilen eines fortlaufendes Sammelwerks in mehrere Neue

Zusätzlich lassen sich auch temporäre Veränderungen modellieren.

Für Fortsetzungen wird der Prozesss in PRESSoo mittels einer neuen Ereignis-Entität Z1 Serial Transformation modelliert. Diese Ereignisse stehen in natürlicher Beziehung zu den letzten F30 Publication Events des Vorgängerwerkes bzw. zu den ersten F30 Publication Events des Nachfolgewerkes. Dabei werden diese F30 Publication Events mittels Z6 Starting of Publication und Z7 Ending of Publication präzisiert.

PRESSoo-Figure-4

Beispiel 1:
Förderschulmagazin : individuelle Förderung von Kindern mit Lernschwierigkeiten
früher: Sonderschulmagazin : Compacts, Arbeitsvorlagen, Verfahren, Formen, Techniken für d. Unterrichtspraxis
früher: Ehrenwirth-Sonderschulmagazin : Zeitschr. für d. Unterrichtspraxis

PRESSoo-Beispiel-1

PRESSoo-Beispiel-1b

<http://ld.zdb-services.de/resource/800272-1> [
  a frbroo:F18_Serial_Work ;
  rdaGr1:preferredTitleForTheWork "Ehrenwirth-Sonderschulmagazin : Zeitschr. für d. Unterrichtspraxis" ;
  pressoo:Y1i_was_continued_through [
    a pressoo:Z1_Serial_Transformation ;
	pressoo:Y2_initiated_as_continuation <http://ld.zdb-services.de/resource/798053-x> ;
  ] ;
  pressoo:Y29_evolved_to <http://ld.zdb-services.de/resource/798053-x> ;
] .

<http://ld.zdb-services.de/resource/798053-x> [
  a frbroo:F18_Serial_Work;
  rdaGr1:preferredTitleForTheWork "Sonderschulmagazin : Compacts, Arbeitsvorlagen, Verfahren, Formen, Techniken für d. Unterrichtspraxis" ;
  pressoo:Y1i_was_continued_through [
    a pressoo:Z1_Serial_Transformation ;
	pressoo:Y2_initiated_as_continuation <http://ld.zdb-services.de/resource/1217829-9> ;
  ] ;
  pressoo:Y29_evolved_to <http://ld.zdb-services.de/resource/1217829-9> ;
] .

<http://ld.zdb-services.de/resource/1217829-9> [
  a frbroo:F18_Serial_Work;
  rdaGr1:preferredTitleForTheWork "Förderschulmagazin : individuelle Förderung von Kindern mit Lernschwierigkeiten" ;
] .

PRESSoo ermöglicht neben den diversen Transformationen auch die Modellierung von Faksimiles, Digitalisierungen ((Hier kommt auch die CIDOC CRM-Erweiterung CRMdig zum Einsatz.)) und sogar kumulierten Fassungen. Die Modellierung von Kumulationen kann bespielsweise für die Bindeeinheiten in Bibliotheksbeständen herangezogen werden. Dabei wird dann das zugehörige F30 Publication Event durch die Buchbinderei durchgeführt.

Beschreibung der Entität Z12 Issuing rule
Im deutschen Bibliothekswesen entwickeln sich derzeit einige Mikroontologien rund um die Darstellung von Bibliotheksservices und bibliographischen Metadaten im Linked Data Kontext. Als Beispiele seien hier DAIA, PAIA, DSO, SSSO, MWO und ECPO genannt. Letztere stellt eine Ontologie zur Beschreibung von Erscheinungsweisen und Bestandsverläufen bei fortlaufenden Sammelwerken dar. ((Die Ontologie geht davon aus, dass auch von Zeitschriften Exemplare exisitieren (“An Agent always holds a copy of a document called item.”). Im Sinne der FRBR ist das allerdings so nicht korrekt und gilt nur in dem Fall, dass ein fortlaufendes Sammelwerk sein Erscheinen eingestellt hat. Mit PRESSoo wurde daher eine Entität Z9 Storage Unit eingeführt, die die Bestände von z.B. Bibliotheken beschreibt. ECPO ist allerdings so definiert (es wird keine Aussage zur Domain bei den zentralen Relationen gemacht), dass die Konzepte auch für F18 Serial Work anwendbar sind.)) Somit lassen sich also Entitäten Z12 Issuing Rule aus PRESSoo mit Hilfe von ECPO beschreiben.

Beispiel 2: CCQ – Cataloging & classification quarterly
Erscheinungsverlauf nach ZDB: 1.1980/82; 2.1982; 3.1982/83 –

<http://ld.zdb-services.de/resource/801602-1> [
  a frbroo:F18_Serial_Work;
  rdaGr1:preferredTitleForTheWork "Cataloging & classification quarterly" ;
  pressoo:Y38_has_current_issuing_rule [
    a ecpo:CurrentChronology, pressoo:Z12_Issuing_Rule ;
    dct:hasPart [
      a ecpo:Chronology, pressoo:Z12_Issuing_Rule ;
      ecpo:hasItemizedVolumeNumbering "1" ;
      ecpo:hasItemizedTemporal "1980/82" ;
    ];
    dct:hasPart [
      a ecpo:Chronology, pressoo:Z12_Issuing_Rule ;
      ecpo:hasItemizedVolumeNumbering "2" ;
      ecpo:hasItemizeTemporal "1982" ;
    ];
    dct:hasPart [
      a ecpo:CurrentChronology, pressoo:Z12_Issuing_Rule ;
      ecpo:hasBeginVolumeNumbering "3" ;
      ecpo:hasBeginTemporal "1982/83" ;
    ];
  ];
] .

Fazit
Mit den beiden hier beschriebenen Ontologien ließe sich die deutsche Zeitschriftendatenbank (ZDB) CIDOC CRM-kompatibel als Linked Data veröffentlichen und würde so eine integrierte Verwendung im gesamten Bereich des kulturellen Erbes ermöglichen.

“Wissenswelten neu gestalten” — Eindrücke vom 5. BID-Kongress in Leipzig

Vom 11. bis 14. März fand in Leipzig der 5. Bibliothekskongress unter dem Motto “Wissenswelten neu gestalten” statt. Neben den wie immer äußerst interessanten Randgesprächen, habe ich mich in diesem Jahr den Themenfeldern “Forschungsdokumentation”, “Zukunft der Verbünde” und “neue Wege in der Erschließung” gewidmet.

Die Rolle der Bibliotheken bei der Forschungsdokumentation
Jede wissenschaftliche Einrichtung stellt an sich den Anspruch, nach den Regeln guter wissenschaftlicher Praxis zu arbeiten. Hierzu heißt es beispielweise in den Regeln für die TU Dortmund:

Hierzu gehört es, lege artis zu arbeiten, korrekte Angaben zu machen, geistiges Eigentum anderer zu achten sowie andere in ihrer Forschungstätigkeit nicht zu beeinträchtigen. […]
Im Zusammenhang der Veröffentlichung schließt dies insbesondere Folgendes ein:
– Die nachvollziehbare Beschreibung der angewandten Methoden,
– die vollständige Dokumentation aller im Forschungsprozess erhobenen und für die Veröffentlichung relevanten Daten,
– eine nachprüfbare Darstellung der Forschungsergebnisse […]

Neben dieser grundlegenden Motivation für die Forschungsdokumentation müssen Wissenschaftlerinnen und Wissenschaftler immer wieder für verschiedenste Zwecke ihre Forschungsaktivitäten neu erfassen und dokumentieren. Genannt seien hier beispielhaft Akkreditierungen, externe Evaluationen, aber auch bei der Beantragung von Projekten, Sonderforschungsbereichen und Exzellenz-Clustern. Wie wichtig ein einheitliches Vorgehen bei der Forschungsdokumentation ist, zeigt auch das vor wenigen Wochen veröffentlichte Papier “Empfehlungen zu einem
Kerndatensatz Forschung
” des Wissenschaftsrates.
Seit Jahren unterstützen Bibliotheken einen Teilaspekt der Forschungsdokumentation durch die Bereitstellung von institutionellen Repositorien für die Veröffentlichung von Dokumenten.
Allerdings ist bekannt, dass eine weitreichende Nutzung durch die Wissenschaftlerinnen und Wissenschaftler in den meisten Fällen bisher nicht zu beobachten ist. Die Session “Quo vadis Repositorien in Deutschland?” – veranstaltet von der DINI-AG Elektronisches Publizieren (12.03.2013 13:30-17:30) – ging daher der Frage nach, wohin die Reise mit den institutionellen Repositorien geht.
Nach der Vorstellung weiterer Ergebnisse aus dem “Census der Open Access Repositorien in Deutschland 2012” (erste ernüchternde Ergebnisse wurden bereits auf der InetBib-Tagung in Berlin vorgestellt), wurde durch weitere Impulsreferate der Trend erkennbar, dass institutionelle Repositorien immer häufiger als für sich stehende Systeme abgelöst werden und viel mehr als Teil einer Plattform zur Forschungsdokumentation eingesetzt werden. So wurden Systeme gezeigt, die als Bibliographien die Publikationsleistungen der Wissenschaftlerinnen und Wissenschaftler einer Einrichtung möglichst vollständig dokumentieren und das Repositorium im Hintergrund “nur noch” die zugehörigen Dokumente liefert. Rund um diese Bibliographien lassen sich wesentlich leichter Mehrwertdienste anbieten, die den Forschenden u.a. bei der Zusammenstellung von Publikationslisten für die verschiedensten Anwendungszenarien unter die Arme greifen.
In der Session “Forschungsdaten sammeln und strukturieren” (12.03.2013 09:00-12:00) wurde der Trend zu allumfassenden Plattformen zur Forschungsdokumentation ebenfalls sichtbar, wobei hier noch der Aspekt der Sammlung und Aufbewahrung von Forschungsdaten hinzukam.

Was die Rolle von wissenschaftlichen Bibliotheken beim Aufbau von virtuellen Forschungsumgebungen angeht, gibt es verschiedene Ansichten. Doch davon unabhängig, ist das Thema Forschungsdaten und deren Infrastrukturen sehr relevant für die tägliche Arbeit.
Den Bibliotheken fällt – insbesondere durch die Fachreferentinnen und Fachreferenten – die Rolle zu, als Ansprechpartner und Berater für die Wissenschaftlerinnen und Wissenschaftler zu fungieren. Fragen nach geeigneten Metadaten für Forschungsdaten und zu für das Fachgebiet geeigneten Repositorien sowie virtuellen Forschungsumgebungen werden im Alltag immer häufiger gestellt. Dabei sehen die Forschenden die Bibliotheken als genau die richtigen Ansprechpartner an, da diese sich seit jeher mit Metadaten beschäftigen und durch den Betrieb von institutionellen Repositorien in der Regel auch Publikations- und Archivierungsservices für Dokumente bereithalten.
Es verwundert daher nicht, dass das Thema Forschungsdaten einen wichtigen Teil im Programm des Bibliothekskongresses in Leipzig bildete. Ein aus meiner Sicht sehr wichtiger Beitrag wurde durch die Session “Forschungsdaten-Repositorien – Infrastrukturen zur dauerhaften Zugänglichkeit von Forschungsdaten” am Montagmorgen (11.03.2013 09:00-11:30 ) geliefert.
Die Session gab eine Einführung in das Themenfeld und stellte Typen und Entwicklungen der heterogenen Landschaft der Forschungsdaten-Repositorien vor. Weiterhin wurden Stand und Entwicklung des von der DFG geförderten Projektes re3data.org vorgestellt und diskutiert. Das Projekt verfolgt das Ziel, Forschungsdaten-Repositorien in einem web-basierten Verzeichnis zu erschließen und so eine Orientierung über bestehende Datensammlungen zu bieten.
Am Beispiel der Aktivitäten der Humboldt-Universität zu Berlin stellte Elena Simukovic heraus, dass es für eine gute Forschungsdokumentation einer Kooperation zwischen dem Hochschulreferat für Forschung, der Bibliothek, dem Rechenzentrum und des jeweiligen Fachbereichs bedarf. Ferner sollte sich die Einrichtung ein Bild darüber verschaffen, wie sich die Wissenschaftlerinnen und Wissenschaftler über die Fachgebiete verteilen. Daraus können dann Schlussfolgerungen in Bezug auf die Notwendigkeit von eigenen institutionellen Forschungsdateninfrastrukturen gezogen werden. Denn eines dürfte schnell klar werden: eine allumfassende Versorgung bei der Sammlung und Archivierung von Forschungsdaten durch eine Universität ist kaum realisierbar. Diese Entwicklung zeigte auch Jana Porsche vom IST Austria in der Session “Forschungsdaten sammeln und strukturieren” auf.

Es lässt sich resümieren, dass das Thema Forschungsdaten und virtuelle Forschungsumgebungen auf jeden Fall für wissenschaftliche Bibliotheken relevant ist. In welcher Form – ob eher beratend oder sogar als Infrastruktur – ist sicherlich von der jeweiligen Einrichtung anhängig.

Neue Wege der Erschließung
Neben Vorträgen rund um die Entwicklungen zum neuen Katalogisierungsregelwerk RDA (Resource, Description and Access) gab es auch Vorträge zu automatischen Erschließungsverfahren. Ich möchte hier den Workshop “Anwendung von Clustering-Verfahren zur Verbesserung und Analyse von Katalogdaten” (13.03.2013 09:00-12:00) hervorheben. In diesem Workshop wurde anschaulich dargestellt, welche neuen Möglichkeiten die als Open Data veröffentlichten bibliographischen Metadaten in Bezug auf die Anreicherung und Korrektur derselbigen bieten. Als Beispiele wurden u.a. Statistiken und Analysen zur Verwendung von RSWK/RVK, der Aufbau von Konkordanzen zwischen Klassifikationssystemen oder die teilautomatische Normierung von bisher als Freitext erfasster Informationen genannt. Solche Verfahren werden mit der stetig wachsenden Verbreitung der Discovery Services bzw. der dahinter liegenden großen Indizes immer wichtiger, da diese Daten häufig weder normiert noch sachlich erschlossen sind.
In der Veranstaltung blieb es aber nicht nur bei Lippenbekenntnissen, sondern es wurde auch ein Open Source-Framework zur Verarbeitung von großen Metadatenmengen vorgestellt. Die Software Metafacture wurde im Rahmen des Projektes CultureGraph entwickelt und stellt ein niederschwelliges Framework zur Metadatenanalyse und Konvertierung dar.

Zukunft der Verbünde
Die Entscheidung über die Vergabe der DFG-Mittel zur Neuausrichtung überregionaler Informationsservices und insbesondere die Entscheidung, welche Richtung die Bibliotheksdateninfrastruktur und die lokalen Bibliothekssysteme (Ausschreibung “Themenfeld 1”) einschlagen sollen, sorgte doch an einigen Stellen für Diskussionen und sogar ein gewisses Knistern war zu vernehmen. Es konkurrierten hier zwei Ansätze, die unterschiedlicher kaum sein konnten. Beide Ansätze wurden in der Session “Die Bibliotheksverbünde auf dem Weg in die Zukunft – Serviceleistungen und Dienste für Bibliotheken” vorgestellt (13.03.2013 13:30-15:30) und teils kontrovers diskutiert.
Wer nun gewonnen hat, kann auf den Seiten der DFG nachgelesen werden. Ich enthalte mich jetzt hier weiterer Kommentare …

Weitere Informationen:
Empfehlungen zu einem Kerndatensatz Forschung des Wissenschaftsrates
Pressemitteilung der DINI zu den “Empfehlungen zu einem Kerndatensatz Forschung”
Beiträge BID 2013 im Opus-Server

FRBRoo und fortlaufende Sammelwerke

Bei der Definition der FRBRoo wurde darauf geachtet, dass die Begrifflichkeiten der ursprünglichen Functional Requirements for Bibliographic Records noch präzisiert werden. Diese begriffliche Abklärung ergibt sich in vielen Fällen aus der Darstellung der bibliographischen Information als Prozess. Als ein Beispiel wurde in FRBRoo — eine Anwendung schon die Klasse Work mit ihren präzisierenden Unterklassen dargestellt. Insbesondere wurde mit der Klasse F18 Serial Work eine Möglichkeit geschaffen, die Unklarheiten zu Serials, also den fortlaufenden Sammelwerken, in den FRBR zu beseitigen. In den FRBR ist eindeutig beschrieben, dass eine Manifestation in dem Sinn abgeschlossen sein muss, dass man ein Exemplar kaufen und ins Regal stellen kann. Bei fortlaufenden Sammelwerken ist das nicht möglich, solange es weitere Bände –- beispielsweise in Form von Jahrgängen und Heften -– gibt. In FRBRoo heißt es dazu:

This class comprises works that are, or have been, planned to result in sequences of manifestations with common features. Whereas a work can acquire new members over the time it evolves Expressions and Manifestations are identified with a certain state achieved at a particular point in time. Therefore there is in general no single expression or manifestation representing a complete serial work, unless the serial work is ended. […] Serial Works may or may not have a plan for an overall expression.

Es ist zu beachten, dass FRBRoo keine Unterscheidung zwischen Serien und Reihen bzw. Periodika macht, da der Unterschied “nur” in der Art der Erscheinungsweise liegt und dies über andere Mechanismen modellierbar ist. Somit ergeben sich zwei Fälle:

  • fortlaufende Sammelwerke mit eingebetteten mehrbändigen Werken und
  • fortlaufende Sammelwerke ohne eingebettete mehrbändige Werke

Zu Ersteren zählen beispielsweise Zeitschriften mit Jahrgangzählung.

Fortlaufende Sammelwerke mit eingebetteten mehrbändigen Werken

Nachdem, was in dieser Beitragsreihe bisher gezeigt wurde, lässt sich ein mehrbändiges Werk innerhalb eines fortlaufenden Sammelwerks als F15 Complex Work beschreiben. Dass dies auch im Falle von Periodika gilt, in dem die Jahrgänge in der Regel Fortsetzungswerke sind, wird auch durch folgendes Zitat aus der Definition zu F15 Complex Work deutlich: “One part may not be finished when another is already revised.”
Die Komponente des unbestimmten Endes eines fortlaufenden Sammelwerks entsteht also bei der Einbindung der Complex Works der Mehrbänder in das Serial Work. In der folgenden Abbildung wird das F15 Complex Work zum Publikationsprozess dann noch zusätzlich um die Struktur des F18 Serial Work erweitert.

HGB_F18

Fortlaufende Sammelwerke ohne eingebettete mehrbändige Werke

Die letzte Abbildung zeigt auch, wie sich dieser Fall aus den vorherigen Modellen herleiten lässt. Da es sich hier um Einzelwerke und Sammelwerke handelt, die in einer Reihe erschienen sind, werden die Individual Works und somit auch die Aggregation Works als member eines Serial Work definiert.

Beispiel für fortlaufende Sammelwerke

Und nun?

In dieser Beitragsreihe habe ich gezeigt, dass man mittels FRBRoo bibliographische Daten als Linked Data darstellen kann. Ich hoffe, dass ich ebenfalls zeigen konnte, dass man vor den FRBRoo keine Angst haben muss 😉

Eines sollte man bei der Betrachtung solcher Modelle immer im Hinterkopf haben: Bibliographische Metadaten müssen nicht in dieser Form katalogisiert werden, sie werden lediglich so gespeichert!
Wir müssen uns im Bibliothekswesen von dem Gedanken verabschieden, dass wir die Datenfelder in den Formaten als MAB/MARC-Feld-Wert-Paare und deren Unterfeldern erfassen müssen, wie es in den einschlägigen integrierten Bibliothekssystemen derzeit der Fall ist.
Es sollten vielmehr Erfassungssysteme entwickelt werden, die eine semantisch reichhaltige Verknüpfung zu Daten aus der Linked Open Data Cloud zulassen und die wenigen noch übrig bleibenden Zeichenketten und Zahlen in einfachen Formularen erfassen. Die semantischen Netze der Datenmodelle, wie sie die FRBRoo darstellen, werden im Hintergrund und vom (bibliothekarischen) Nutzer verborgen angelegt.

Beispiele: FRBRoo und fortlaufende Sammelwerke

Beispiele für FRBRoo und fortlaufende Sammelwerke

Nachrichten für Dokumentation in Technik und Wissenschaft, Wirtschaft und Verwaltung. (Hauptsachtitel)

  • Nachrichten für Dokumentation : nfd ; Zeitschrift für Informationswissenschaft und -praxis ; Mitteilungsblatt des Normenausschusses Bibliotheks- und Dokumentationswesen im DIN, Deutsches Institut für Normung e.V., des VDD – Berufsverband Information, Dokumentation, Kommunikation e.V. und der Arbeitsgemeinschaft der Spezialbibliotheken (ASpB) / hrsg. von d. Deutschen Gesellschaft für Dokumentation e.V., Frankfurt am Main / Deutsche Gesellschaft für Dokumentation, Informationszentrum für Informationswissenschaft und -praxis .
    1.1950 – 48.1997,4. : Darmstadt : Hoppenstedt (Frankfurt, M. : Dt. Ges. für Dokumentation [1950-1973], Pullach bei München : Verl. Dokumentation [1974-1977], München [u.a.] : Saur [1978-1986], Weinheim : VCH [1987-1991]).
    ZDB-ID: 206965-9
  • Nfd : Information – Wissenschaft und Praxis ; Mitteilungsblatt des Normenausschusses Bibliotheks- und Dokumentationswesen im DIN, Deutsches Institut für Normung e.V. und der Arbeitsgemeinschaft der Spezialbibliotheken (ASpB) / hrsg. von der Deutschen Gesellschaft für Informationswissenschaft und Informationspraxis e.V. /
    Deutsche Gesellschaft für Informationswissenschaft und Informationspraxis.
    48.1997,5 – 52.2001 : Frankfurt, M. : Gesellschaft (Heidelberg : Heidelberger Verl.-Anst. u. Dr. [1997,5]).
    ZDB-ID: 1399316-1.

Neben zahlreichen Verlagswechseln, kommen bei diesem fortlaufenden Sammelwerk mit eingebetteten mehrbändigen Werken noch einige Titeländerungen und Änderungen bei der herausgebenden Körperschaft hinzu. In der folgenden Abbildungen werden daher nur ein paar Änderungen verdeutlicht.

Beispiel Serial Work für eine Zeitschrift

Zu beachten ist, dass die Änderungen sämtlichst auf der Ebene der Zeitschriftenhefte erfasst wird, da die Zeitschrift ansich (das F18 Serial Work) keine eigene Manifestation besitzt.
Die Erfassung der Titeländerungen für die Zeitschrift können zusätzlich über Teilereignisse des F30 Publication Event des zugehörigen Heftes abgebildet werden. Diese Teilereignisse sind mittels CRM als E13 Attribute Assignment darstellbar und bilden den Prozess der Titelvergabe für das F18 Serial Work ab. Mit Hilfe von Vorgänger- und Nachfolgerrelationen der Ereignisse ist es dann möglich, dem fortlaufenden Sammelwerk den aktuellen Titel zuzuweisen (“E13 Attribute Assignment enthält keine Eigenschft P120 occours before“).

Beispiel Serial Work Zeitschrift Titeländerung

Mögliche RDF-Darstellung

siehe / see: example5.ttl

Sammelwerke, Sammlungen, mehrbändig begrenzte Werke und FRBRoo

Im Beitrag FRBRoo — Eine prozessorientierte Sicht auf bibliographische Informationen habe ich gezeigt, wie sich Einzelwerke mittels FRBRoo darstellen lassen. Im folgenden wird das Modell auf Sammelwerke, Sammlungen und mehrbändig begrenzte Werke ausgeweitet.

Ein Sammelwerk oder eine Sammlung zeichnet sich dadurch aus, dass es Expressions anderer Werke in sich vereint oder anders ausgedrückt aggregiert. Für diese Werke gibt es in den FRBRoo die Entität F17 Aggregation Work, welches die Eigenschaften des F14 Individual Work und des F16 Container Work in sich vereint:

This class comprises works whose essence is the selection and/or ar-rangement of expressions of one or more other works. This does not make the contents of the aggregated expressions part of this work, but only part of the resulting expression. F17 Aggregation Work may include additional original parts.

An diesem Publikationstyp sind somit mehrere Werke und deren Realisierungen beteiligt: zum einen sind dies die Werke der Beiträge, zum anderen ist es das Sammelwerk an sich. Daraus folgt auch, dass es einige zu betrachtende Prozesse gibt.

Die Schöpfungsprozesse sind zunächst mal dem des Einzelwerks sehr ähnlich (bei den Beiträgen handelt es sich um Einzelwerke, beim Sammelwerk handelt es sich um ein F17 Aggregation Work, welches von F14 Individual Work abgeleitet ist). Allerdings kommt hinzu, dass die aus den Beiträgen entstandenen Expressions neben ihrer Eigenschaft sich selbst zu enthalten (F22 Self-contained Expression) auch Fragmente (F23 Expression Fragment) einer übergeordneten Expression, der des Sammelwerks, sind. Die nächste Abbildung stellt dies graphisch dar. Somit ist eine Expression/span> eines Beitrags gleichzeitig Instanz von F22 und F23.

Die soeben beschriebene Fragmentierung gilt auch im Publikationsprozess. So erhält jede Expression eines Beitrags eine eigene F24 Publication Expression. Somit gilt für die Expressions im Publikationsprozess, dass sie gleichzeitig Instanzen von F24 und F23 sind.

Sammelwerk

Beispiel

Mehrbändig begrenzte Werke

Bei der Abbildung von mehrbändig begrenzten Werken wird es schon etwas komplexer. Es gibt hier zwei zu unterscheidende Fälle: mehrbändiges Werk im Schöpfungsprozess (bibliographische Einheiten) und mehrbändiges Werk im Publikationsprozess (buchbinderische Einheiten).
Bei der Mehrbändigkeit im Schöpfungsprozess findet die Definition der Entität F15 Complex Work Verwendung:

This class comprises works that have more than one work as members. The members of a Complex Work may constitute components of the overall concept or be alternatives to other members of the work. […] The member relationship of Work is based on the conceptual relationship, and should not be confused with the internal structural parts of an individual expression.

Die Mehrbändigkeit bezieht sich in diesem Fall auf die inhaltliche Ebene. Somit ergibt sich aus dieser Definition direkt die Unterscheidung zur Mehrbändigkeit im Publikationsprozess, bei der sich die Mehrbändigkeit rein praktisch begründet. In letzterem Fall wird die “einbändige” Expression des Verfassers in mehrere Manifestations aufgeteilt.
Die folgende Abbildung stellt ein im Publikationsprozess entstehendes mehrbändiges Werk dar, lässt dabei aber den Aspekt des Produktionsprozesses weitestgehend außen vor, da er sich nicht von dem des Kernmodells unterscheidet. Das vom Verfasser initiierte Werk wird im Vorfeld des Publikationsprozesses in mehrere Fragmente zerlegt (F23 Expression Fragment). Diese werden dann jeweils in den Publikationsprozess geleitet und werden somit zu Publication Works. Diese wiederum ergeben gemeinsam ein komplexes Werk im Sinne der FRBRoo-Definition, da hier eine gemeinsame inhaltliche Konzeption –- in der Regel durch den Verlag -– zugrunde liegt. Somit sind die den Werken zugrundeliegenden Instanzen der Work Conceptions unterschiedliche Ereignisse. (Im Abschnitt “Events in FRBROO: How Each Group 1 Entity Comes into Being” des Beitrags “A Strange Model Named FRBROO. In: Cataloging & Classification Quarterly: Routledge 2012.” stellt Patrick Le Boeuf dar, was genau unter der Work Conception zu verstehen ist.)

Mehrbändig begrenztes Werk im Publikationsprozess

Die entstandenen Complex Works erhalten jeweils einen eigenen Expression-Zweig. Dieser existiert, sobald das Werk vollständig ist, und da es sich hier um mehrbändig begrenzte Werke handelt, ist bereits von der Vollständigkeit auszugehen. Die Expression Creation-Ereignisse der einzelnen Bände sind somit Teilereignisse der Expression Creation des F15 Complex Work (P9 consists of) und die Expressions der Bände sind Teile der Expression des Complex Work. Bei letzterem ist die Teil-Beziehung nicht mit der Enthaltenseinsbeziehung bei Wiederverwendung einer Expression zu verwechseln. In den FRBRoo heißt es zur Relation R5 has component:

This property associates an F2 Expression X with a structural compo-nent Y that conveys in itself the complete concept of a work that is member of (R10) the overall work realized by X. It does not cover the relationship that exists between pre-existing expressions that are re-used in a new, larger expression and that new, larger expression. Such a relationship is modeled by R14 incorporates.

Beispiel für ein im Publikationsprozess mehrbändig begrenztes Werk

In der nächsten Abbildung ist ein im Schöpfungsprozess entstehendes mehrbändiges Werk dargestellt. Im Unterschied zum vorigen Fall findet hier die Zerlegung schon auf Werksebene statt, da der Verfasser schon bei der Konzeption einen Mehrbänder im Sinn hat. Diese Bände werden als Individual Works modelliert und durch jeweils eigene Expressions realisiert. Diese wiederum gehen dann getrennt voneinander in den Publikationsprozess. Wie auch im vorigen Fall, bilden die resultierenden Publication Works eine Einheit in Form eines Complex Work. Für den Fall, dass alle Bände von gleicher Auflage und vom gleichen Verfasser sind, so existiert auch hier eine eigene Realisierung bzw. Expression des Complex Work.

Mehrbändig begrenztes Werk im Schöpfungsprozess

Beispiel für ein im Schöpfungsprozess mehrbändig begrenztes Werk

Im nächsten Post “FRBRoo und fortlaufende Sammelwerke” werden die bisherigen Elemente zusammengefügt und somit ein Modell für die fortlaufenden Sammelwerke präsentiert.

Beispiele: FRBRoo für mehrbändig begrenzte Werke / Examples: FRBRoo for Multivolume Works

Beispiele für / Examples for: Sammelwerke, Sammlungen, mehrbändig begrenzte Werke und FRBRoo

Grundlagen der praktischen Information und Dokumentation : ein Handbuch zur Einführung in die fachliche Informationsarbeit / Buder, Marianne ; Laisiepen, Klaus.
München [u.a.]: Saur, 1990.
3., völlig neu gefasste Ausg.
ISBN: 3-598-21253-4

Graphische Darstellung / graphical representation

Beispiel eines mehrbändig begrenzten Werkes im Publikationsprozess

Mögliche RDF-Darstellung / representation in RDF

siehe / see: example3.ttl


Analysis / Forster, Otto.
Bd. 1: Differential- und Integralrechnung einer Veränderlichen.
Braunschweig [u.a.]: Vieweg, 2008. 9., überarb. Aufl.
Bd. 2: Differentialrechnung im R n, gewöhnliche Differentialgleichungen.
Braunschweig [u.a.]: Vieweg, 2008. 8., aktualisierte Aufl.
Bd. 3: Integralrechnung im R n mit Anwendungen.
Braunschweig [u.a.]: Vieweg, 2009. 5., aktualisierte Aufl.

Graphische Darstellung / graphical representation

Beispiel eines mehrbändig begrenzten Werkes im Schöpfungsprozess

Mögliche RDF-Darstellung / representation in RDF

siehe / see: example4.ttl

Beispiel: FRBRoo für Sammelwerke und Sammlungen / Example: FRBRoo for Aggregation Works

Beispiel für / Example for: Sammelwerke, Sammlungen, mehrbändig begrenzte Werke und FRBRoo

Commercial Interchanges Between Greeks and Natives / Graham, Alexander John
In: Collected papers on Greek colonization / Graham, Alexander John (Hrsg.)
Leiden, Boston, Köln : Brill, 2001.

Graphische Darstellung / graphical representation

Sammelwerk Beispiel

Mögliche RDF-Darstellung / representation in RDF

siehe / see: example2.ttl

FRBRoo — Eine prozessorientierte Sicht auf bibliographische Informationen

Nachdem ich in FRBRoo — eine Anwendung meine Motivation in Bezug auf FRBRoo erläutert habe, werde ich im Folgenden die Publikationsformen mithilfe der FRBRoo dargestellen. Dabei stützt sich die Modellierung vor allem auf die Ereigniszentriertheit des CRM, wodurch die Schöpfungs-, Publikations- und Produktionsprozesse transparenter werden.

Für den Fall, dass der geneigte Leser die Definitionen der Publikationsformen nicht mehr so ganz auf dem Schirm hat, stelle ich sie nochmal kurz unter Verwendung des “Bibliothekrischen Grundwissens” von Ganter/Hacker vor.

  • Einzelwerk
    Ein Einzelwerk ist eine in sich geistige abgeschlossene Schöpfung, die zur zusammenhängenden Veröffentlichung vorgesehen ist und in einem oder mehreren Teilen erscheint.
  • Sammlung
    Als Sammlung wird eine Veröffentlichung bezeichnet, in der zwei oder mehr Einzelwerke desselben Verfassers vereinigt sind.
  • Sammelwerk
    Unter Sammelwerk versteht man ein Buch mit mindestens zwei Einzelwerken von zwei oder mehr Verfassern.
  • Fortsetzungswerk
    Fortsetzungswerk nennt man eine mehrbändige Publikation, bei der die einzelnen Bände oder Teile nacheinander in zeitlichen Abständen
  • Fortlaufende Sammelwerke
    Wenn in mehreren Teilen erscheinende Sammelwerke keinen von vornhinein geplanten Abschluss haben, sondern […] ohne Begrenzung der Band- oder Heftzahl erscheinen, nennt man sie fortlaufende Sammelwerke. Dazu zählen Schriftenreihen (Serien) und Periodika (Zeitungen, Zeitschriften, zeitschriftenartige Reihen).

Die zentrale Rolle beim Mapping mit den FRBRoo stellt die Verfeinerung des Werk-Begriffs der FRBR dar.
Die Ausführungen in den originalen FRBR zu den Gruppe-1-Entitäten lassen in einigen Fällen verschiedene Interpretationen zu, die in Teilen zu logischen Inkonsistenzen führen. Insbesondere die Entität Work deckt mehrere Szenarien ab, die in der Realität verschiedene Eigenschaften haben. Die FRBRoo greifen diese Ungenauigkeit auf und definieren das Work als Superklasse und verfeinern diese dann durch Work-Begriffe, welche die verschiedenen Szenarien modellieren können.

Work-Hierarchie der FRBRoo

So entsteht beispielsweise eine Entität Serial Work, die zum einen den intellektuellen Anteil des Verlags berücksichtigt (Publication Work) und zum anderen eine Umgebung für die Aggregation anderer Werke bildet (Complex Work). Dabei ist die soeben genannte Aggregation nicht mit der Aggregation bei Sammelwerken zu verwechseln. Letztere findet auf der Ebene der Expressions statt. In den FRBRoo heißt es zu Aggregation Work:

This class comprises works whose essence is the selection and/or ar-rangement of expressions of one or more other works. This does not make the contents of the aggregated expressions part of this work, but only part of the resulting expression. F17 Aggregation Work may include additional original parts.

Somit fallen hierunter die Sammelwerke und Sammlungen.

Legt man nun die Publikationstypen nach dem bibliothekarischen Standardwerk von Gantert/Hacker zugrunde, so ergibt sich für die Publikationstypen das folgende Bild. Die Abbildung enthält zwei Typen von Relationen: Unter-/Oberklassen (subClassOf) und Teil/Ganzes-Beziehungen (hasPart). Letztere stellen dabei – die insbesondere im deutschen Bibliothekswesen starken – Verknüpfungen zu Überordnungen dar.

Verknüpfungen innerhalb der Publikationsformen

Diese Abhängigkeiten lassen sich nun auf die FRBRoo-Entitäten abbilden, wobei sich Publikationsformen FRBRoo-Entitäten “teilen”. Am Beispiel des fortlaufenden Sammelwerks sind dies die Serie/Reihe und das Periodikum, welche sich das Serial Work teilen. Der formale Unterschied zwischen Serien und Periodika ist “nur” die Beschreibung der Erscheinungsweise. Diese kann aber in einem Modell, wie es die FRBRoo sind, durch die Verwendung entsprechender Vokabulare für die Attribute der Entitäten beschrieben werden.

Abbildung der Publikationsformen auf die Work-Entitäten der FRBRoo

Einzelwerke und die Akteure der Prozesse

Das CRM und somit die FRBRoo liefern durch ihre Ereigniszentriertheit für das Modell drei wesentliche Prozesse: den Schöpfungsprozess (realisiert durch das Ereignis F28 Expression Creation), den Publikationsprozess (realisiert durch das Ereignis F30 Publication Event) und den Produktionsprozess (realisiert durch das Ereignis F32 Carrier Production Event).
Die Beschreibung des Publikationstyps Einzelwerk stellt in einem gewissen Sinne ein Kernmodell dar. So werden darin die grundsätzliche Unterscheidung und die Zusammengehörigkeit der oben genannten Prozesse sichtbar. Die in diesen Prozessen verwendeten Entitäten und Relationen werden bei sämtlichen Publikationstypen wieder verwendet und den Gegebenheiten angepasst. Der Übersichtlichkeit halber wird das Modell in zwei Teilen präsentiert: dem Modell für die materiellen Konzepte und die Ereignisse sowie dem Modell der Akteure.

Einzelwerke

Die Linien der Schöpfungs- und Publikationsprozesse verbinden sich auf der Ebene der Expressions. Hier wird der Tatsache Rechnung getragen, dass der Verlag durch das Hinzufügen seines Layouts und sonstiger, ergänzender Teile die Expression und somit die Realisierung des Schöpfers anreichert. Diese erweiterte Expression wird dann in den Produktionsprozess weitergeleitet.

Aus der Sicht eines Bibliothekskatalogs sind in der Regel zum Schöpfungsprozess des Werks wenige bis keine Informationen bekannt. Die formalen Beschreibungen der Werksebene werden im Bibliothekskontext entsprechend auf der Seite des Publikationsprozesses abgelegt, d.h. insbesondere, dass der Titel, so wie er bei der formalen Erschließung erfasst wird, als Attribut zum F19 Publication Work gehört. Anders ist das bei der Zuordnung der Akteure des Schöpfungsprozesses. Hier ist bei der formalen Erschließung bekannt, dass die angegebenen Personen oder Körperschaften an der Realisierung der Expression mitgewirkt haben.

Die Akteure werden in dem vorliegenden Modell zum einen als Ausführende direkt an die Ereignisse angebunden (unter Verwendung der Relation P14 carried out by des CRM), zum anderen werden die Rollen der Akteure mithilfe des RDA-Vokabulars modelliert. (Das CRM liefert selber auch eine Möglichkeit, den Ausführenden eines Ereignisses eine Rolle zuzuordnen. Und zwar sieht das CRM eine Relation P14.1 in the role of der Relation P14 carried out by vor. Dieses Konstrukt ist in dieser Form aber nicht RDF-konform und müsste durch die Modellierung eines sogenannten Blank-Nodes aufgelöst werden. Da die Verwendung von Blank-Nodes in der Praxis nicht unbedingt empfohlen wird (Vgl. z.B. Heath, Tom u. Christian Bizer: Linked Data. Evolving the web into a global data space. 1. Aufl. San Rafael, Calif: Morgan & Claypool 2011, 2.4.1) und das Bibliothekswesen mit den RDA eine geeignete Alternative hat, wird diese hier auch verwendet.)

Akteure

Die Abbildung zeigt die Verwendung eines weiteren Modells, den FRBRentitesRDA. Hierbei handelt es sich um die Definition der FRBR-Entitäten aus dem RDA-Modell. An dieser Stelle soll nun die Verbindung der Modelle genauer aufgezeigt werden.
Die FRBRoo greifen wie oben erwähnt die Schwachstellen der FRBR auf und versuchen diese zu beheben. Dabei verlassen sie aber nie das Grundvokabular der FRBR-Entitäten. So bleiben die Entitäten Work, Expression, Manifestation und Item in FRBRoo erhalten und bekommen nur die CRM-typische Nummer verliehen. Auch die RDA basieren auf den Konzepten der FRBR. Somit sind die vier Entitäten der FRBR-Gruppe 1 in allen drei Modellen äquivalent bzw. im Fall von F3 Manifestation-Product Type und F4 Manifestation Singleton in FRBRoo abgeleitet. Diese Feststellung ist insofern wichtig, dass es nur dann möglich ist, Relationen und Attribute aus verschiedenen Modellen und Ontologien zu benutzen, wenn die Entitäten in der beschriebenen Weise zusammenpassen.

In der hier vorgestellten Modellierung werden die Entitäten der FRBRoo mit denen der FRBRentitiesRDA „gematcht“, um nicht sämtliche Metadaten zu den Instanzen als CRM oder FRBRoo-Tripel zu beschreiben, was den Graph in seiner Größe förmlich explodieren ließe. Der Vorteil hierbei ist, dass ab einer bestimmten Tiefe des Graphen nur noch bereits bekannte und hoffentlich standardisierte Metadaten verwendet werden.
Verwendet man nur das CRM, so müssen für Aussagen sehr viele Tripel erzeugt werden, bis die Semantik klar ausgedrückt wird, wodurch sehr große Graphen entstehen. Um diese Graphen kleiner zu halten, wird mittels Ontology Alignement ein Mapping zu Modellen erzeugt, die für die gleiche Aussagekraft kürzere Wege erlauben. So entsteht ein durch das CRM zusammengehaltener Graph, dessen Knoten durch fachspezifische Ontologien beschreiben werden.
Auch Mazurek, Cezary et al. berichten in ihrem Beitrag From MARC21 and Dublin Core, through CIDOC CRM. First Tenuous Steps towards Representing Library Data in FRBRoo. von dieser Problematik. Sie zeigen in ihrem Beitrag an einem Beispiel, wie kleinteilig diese Art der Modellierung wäre.

Das bisher beschriebene Modell soll durch ein Beispiel verdeutlicht werden.

In den nächsten Beiträgen zeige ich dann, wie das bei Sammelwerken, Sammlungen und den zugehörigen Beitragen sowie bei mehrbändig begrenzten Werken aussieht.

Weiterlesen: