Library Holdings as Linked Data

Translated by André Hagenbruch / Deutsche Version Deutsche Version

In his blog post „Local library data in the new global framework“ Lukas Koster was spot on when he noted:

It doesn’t really make sense if all libraries in the world publish identical metadata side by side, does it?
In essence only really unique data is worth publishing. You link to the rest.

Among the few examples for the typical library to publish unique Linked Open Data are special collections and the increasingly important field of research data. But the one unique data resource that all libraries have in common is holdings information. As more and more bibliographic data is fed to WWW search engines by publishers, holdings information is an increasingly relevant source for networked and mobile applications.

Small wonder that there already are several approaches to modelling holdings. Among these are:

If you look at my earlier posts in this blog, I have already shown the flexibility and expressiveness of CRM, FRBRoo and PRESSoo. These articles mostly focused on the desciption of bibliographic objects and concepts and only hinted at their usefulness for holdings information. But the ontologies of the CRM universe in conjunction with the concepts from DAIA are very well suited to describe holdings information.

WEM + I in the CIDOC CRM Universe

Taking the University Library Dortmund as a member of the hbz library network I will show how the concepts work, expression, manifestation (WEM), and items (I) are being distributed among these two organisations.3 Whereas the library co-operative takes care of both the bibliographic description of the works, expressions, and manifestations as well as of its own collection descriptions, University Library Dortmund primarily documents their local holdings and builds availability services around them. Thus we avoid the aforementioned process of repeatedly publishing of identical data.

The following diagram illustrates the connection between these two services. It’s limited to the major components and builds on the models described in FRBRoo — eine Anwendung.4

Verbund-Lokal-System_en

On the right side of the diagram you can see the actual holdings which are being modeled by the concept F5 Item from FRBRoo. Moreover, PRESSoo offers a suitable item for journal holdings, i.e. Z9 Storage Unit. The CRM extension CRMdig offers a suitable model for the presentation of digital objects on the level of exemplars.

Holdings information

To describe holdings information with the CRM I use the properties of the exemplar entity’s parent. It holds that:

  • F5 Item subClassOf E84 Information Carrier subClassOf E22 Man-Made Object
  • Z9 Storage Unit subClassOf E22 Man-Made Object
  • D13 Digital Information Carrier subClassOf E84 Information Carrier subClassOf E22 Man-Made Object
  • E22 Man-Made Object subClassOf E19 Physical Object subClassOf E18 Physical Thing

Usually such physical objects are being kept in a certain location and can eventually be made available to the user. These locations can be described with CRM concept E27 Site. Quoting the CRM:

In contrast to the purely geometric notion of E53 Place, this class describes constellations of matter on the surface of the Earth or other celestial body, which can be represented by photographs, paintings and maps.

Thus we can make statements about cohesion or ownership with respect to locations like branches, sections, departments, or stacks using E27 Site. To this end we can employ the following relations of the CRM (E27 Site subClassOf E18 Physical Thing):

  • E18 Physical Thing P46 is composed of (forms part of) E18 Physical Thing
  • E18 Physical Thing P52 has current owner (is current owner of) E39 Actor
  • E18 Physical Thing P58 has section definition (defines section) E46 Section Definition

Holdings information

Example 1: The FRBR family of conceptual models

<http://data.ub.tu-dortmund.de/resource/item/20129967> [
  a frbroo:F5_Item ;
  rdfs:label "A 12726" ;
  ecrm:P52_has_current_owner <http://lobid.org/organisation/DE-290> ;				
  ecrm:P46i_forms_part_of [
	a ecrm:E27_Site ;
	ecrm:P58_has_section_definition [
		a ecrm:E46_Section_Definition ;
		rdfs:label "Second Floor"
	]  ;
	ecrm:P46i_forms_part_of [
		a ecrm:E27_Site ;
		ecrm:P58_has_section_definition [
			a ecrm:E46_Section_Definition ;
			rdfs:label "Central Library"
		] ;
		ecrm:P46i_forms_part_of [
		  a ecrm:E27_Site ;
		  ecrm:P58_has_section_definition [
			a ecrm:E46_Section_Definition ;
			rdfs:label "TU Dortmund, University Library"
		  ] ;
		] ;
	] ;
  ] ;  
] .

Here we describe the item with the call number „A 12726“ located on the second floor of the central library of the University Library Dortmund. We could enrich the description of the central library by adding for instance geo information as it is one of eight sites making up the entire University Library. This geo information then describes an E53 Place linked to a P53 has former or current location.

Ongoing serials (F18 Serial Work) or journals as their special case have to be viewed from a point of view of storage practices. With the exception of the most recent isuues, items of journal issues are mostly available as a series of bound units. Usually these series are not further specified, but hold a common call number.5
The following diagram shows both the most current issue in its original binding and the result of the binding process and its relation to Z9 Storage Unit. By transforming the items to a new object the latter becomes an item of a new cumulative Publication Work. This Publication Work in turn is part of an ongoing serial work of type series.

Items_of_Serial_Works

The holdings information is now distributed on two objects:

  • Z9 Storage Unit is being described similarly to F5 Item in example 1.
  • The holdings history is being assigned to the newly created F18 Serial Work by means of ECPO.6

In the following example the journal’s holdings information is being illustrated with a partial Z9 Storage Unit, leaving out the chronology.

Example 2: Bibliotheksdienst
According to the model outlined above this journal has two Z9 Storage Units, as it has been acquired by two branches of the University Library Dortmund.

<http://data.ub.tu-dortmund.de/resource/storageunit/ZA_377> [
  a pressoo:Z9_Storage_Unit ;
  rdfs:label "ZA 377" ;
  ecrm:P52_has_current_owner <http://lobid.org/organisation/DE-290> ;	
  ecrm:P46I_forms_part_of [
	a ecrm:E27_Site ;
	ecrm:P58_has_section_definition [
		a ecrm:E46_Section_Definition ;
		rdfs:label "Basement Level 1"
	]  ;
	ecrm:P46I_forms_part_of [
		a ecrm:E27_Site ;
		ecrm:P58_has_section_definition [
			a ecrm:E46_Section_Definition ;
			rdfs:label "Central Library"
		] ;
		ecrm:P46I_forms_part_of [
		  a ecrm:E27_Site ;
		  ecrm:P58_has_section_definition [
			a ecrm:E46_Section_Definition ;
			rdfs:label "TU Dortmund, University Library"
		  ] ;
		] ;
	] ;
  ] ;  
] . 

<http://data.ub.tu-dortmund.de/resource/storageunit/Bibliotheksdienst> [
  a pressoo:Z9_Storage_Unit ;
  rdfs:label "Bibliotheksdienst" ;
  ecrm:P52_has_current_owner <http://lobid.org/organisation/DE-290> ;				
  ecrm:P46I_forms_part_of [
	a ecrm:E27_Site ;
	ecrm:P58_has_section_definition [
		a ecrm:E46_Section_Definition ;
		rdfs:label "R. 501"
	]  ;
	ecrm:P46I_forms_part_of [
		a ecrm:E27_Site ;
		ecrm:P58_has_section_definition [
			a ecrm:E46_Section_Definition ;
			rdfs:label "Bibl. Sozialforschungsstelle"
		] ;
		ecrm:P46I_forms_part_of [
		  a ecrm:E27_Site ;
		  ecrm:P58_has_section_definition [
			a ecrm:E46_Section_Definition ;
			rdfs:label "TU Dortmund, University Library"
		  ] ;
		] ;
	] ;
  ] ;  
] .

Services for Items

Holdings information decoupled from pertinent services of the organisation isn’t much worth in the Linked Open Data Cloud. Only through coupling items with services such as loan can we offer surplus values that are not normally available through the bibliographic description alone.

As I already said in my previous post, currently a few micro ontologies dealing with the modelling of library services and bibliographic metadata in the linked data context are being developed by the German library community. To describe these services and statuses, we can use DAIA, DSO, and SSSO.

The following diagram shows the linkage of the Document Service Ontology to the Z9 Storage Unit via DAIA. For this we have to assume that the concept of Document in DSO and DAIA is compatible with Z9 Storage Unit.7

Z9-DAIA

The linked Document Services are being described by the Simple Service Status Ontology. Thus, we can make statements such as ‚Item A is unavailable until date X.‘

Example 3: loanable item with property daia:availableFor

<http://data.ub.tu-dortmund.de/resource/item/20129967> [
  a frbroo:F5_Item ;
  rdfs:label "A 12726" ;
  daia:availableFor [
    a dso:Loan ;
  ] ;
  ecrm:P52_has_current_owner <http://lobid.org/organisation/DE-290> ;				
  ecrm:P46I_forms_part_of [
	a ecrm:E27_Site ;
	ecrm:P58_has_section_definition [
		a ecrm:E46_Section_Definition ;
		rdfs:label "Second Floor"
	]  ;
        ...
  ] ;  
] .

Example 4: issue of a serial work available for presentation and interlibrary loan

<http://data.ub.tu-dortmund.de/resource/storageunit/ZA_377> [
  a pressoo:Z9_Storage_Unit ;
  rdfs:label "ZA 377" ;
  daia:unavailableFor [
    a dso:Loan ;
  ] ;
  daia:availableFor [
    a dso:Presenation ;
  ] ;
  daia:availableFor [
    a dso:Interloan;
  ] ;
  ecrm:P52_has_current_owner <http://lobid.org/organisation/DE-290> ;	
  ecrm:P46I_forms_part_of [
	a ecrm:E27_Site ;
	ecrm:P58_has_section_definition [
		a ecrm:E46_Section_Definition ;
		rdfs:label "Basement Level 1"
	]  ;
        ...
  ] ;  
] .

Conclusion
I have shown that we can make meaningful statements about holdings information using the existing ontologies and that there is no need for developing new vocabularies. As an afterthought, we might even also describe acquisition information within the CIDOC CRM framework. The simplest approach would be to use the concept E8 Acquisition Event to model an acquisition event and to describe it via EDIFACT data as an E31 Document.

  1. Wiki of the DINI-KIM-WG []
  2. EDINA is the Jisc-designated national data centre at the University of Edinburgh. []
  3. The catalog of the NRW library network is being operated by the Hochschulbibliothekszentrum NRW (hbz) and is an effort of the participating libraries cataloging into a central integrated library system. The data captured there are then being replicated to the local library systems. []
  4. currently only in German []
  5. The volumes of „simple series“ can be described as objects of ‚classic book format‘ which are not being bound as books in frequent intervals. Thus, they won’t be considered in this article. []
  6. see also: „PRESSoo und ECPO – Zwei weitere Ontologien zur Beschreibung von fortlaufenden Sammelwerken“ (currently only in German) []
  7. The DSO specification says: ‚The set of documents is not limited to a specific class […]‘. Thus, the assumption holds true. The DAIA specification would have to be extended insofar as it only considers frbr:items valid at this point. []

Bestandsnachweise von Bibliotheken als Linked Data

English Version English Version

Lukas Koster formulierte in seinem Blog-Beitrag „Local library data in the new global framework“ sehr treffend:

It doesn’t really make sense if all libraries in the world publish identical metadata side by side, does it?
In essence only really unique data is worth publishing. You link to the rest.

Unter den wenigen Beispielen, in denen typische Bibliotheken unikale (Meta-)Daten als Linked Open Data veröffentlichen können, sind spezielle
Sammlungen und auch die immer wichtiger werdenden Forschungsinformationen wissenschaftlicher Einrichtungen. Eine wichtige Datenmenge, die alle Bibliotheken gemeinsam haben, ist aber tatsächlich die der Bestandsnachweise.
In Zeiten, in denen bibliographische Informationen direkt von den Verlagen in die Suchmaschinen des WWW wandern, sind die Bestandsnachweise als Quelle für vernetzte und insbesondere auch mobile Anwendungen interessantes Material.
So wundert es nicht, dass es mittlerweile mehrere Ansätze für die Beschreibung der Bestände gibt. Genannt seien hier:

Betrachtet man u.a. die bisherigen Beiträge dieses Blogs, so wurde die Flexibilität und Aussagekraft von CRM, FRBRoo und PRESSoo bereits bewiesen. Diese Beiträge haben sich bisher weitestgehend auf die Beschreibung von bibliographischen Objekten und Konzepten bezogen, wobei der Bereich des Bestandsnachweises nur kurz angerissen wurde.

Aber auch mit den Ontologien des CRM-Universums in Verbindung mit den Konzepten rund um DAIA können die Bestandsnachweise sehr gut beschrieben werden.

WEM + I im CIDOC CRM-Universum
Am Beispiel des Katalogs der UB Dortmund und des „hbz-Verbundkatalogs“3 soll zunächst gezeigt werden, wie eine zentrale Stelle identische Metadaten verschiedener Quellen — hier also konkret die Bereiche Work, Expression, Manifestation (WEM) — als Linked Data publizieren kann und die unikalen Metadaten der Items (I) durch die Lokalsysteme publiziert werden können.
Das folgende Diagramm stellt die Verlinkung der beiden Metabereiche dar. Dabei beschränkt es sich auf die wesentlichen Komponenten und setzt die Modelle aus FRBRoo — eine Anwendung voraus.

Verbund-Lokal-System

Das obige Diagramm zeigt auf der Seite der tatsächlichen Bestände nur das Konzept der F5 Item aus FRBRoo. Mit dem Erscheinen von PRESSoo gibt es auch für die Bestände von Zeitschriften ein geeignetes „Item“, nämlich Z9 Storage Unit. Auch für digitale Objekte gibt es mit der CRM-Erweiterung CRMdig eine geeignete Darstellung auf Exemplarebene.

Bestandsnachweise
Um nun die Bestandsnachweise mit dem CRM zu beschreiben, macht man sich die Eigenschaften der Eltern-Entitäten der Exemplar-Entitäten zu nutze. Es gilt:

  • F5 Item subClassOf E84 Information Carrier subClassOf E22 Man-Made Object
  • Z9 Storage Unit subClassOf E22 Man-Made Object
  • D13 Digital Information Carrier subClassOf E84 Information Carrier subClassOf E22 Man-Made Object
  • E22 Man-Made Object subClassOf E19 Physical Object subClassOf E18 Physical Thing

Üblicherweise werden solche physischen Dinge an bestimtmen Orten aufbewahrt und gegebenenfalls zugänglich gemacht. Die Aufbewahrungsorte können mit dem CRM-Konzept E27 Site beschrieben werden. Im CRM heißt es dazu:

In contrast to the purely geometric notion of E53 Place, this class describes constellations of
matter on the surface of the Earth or other celestial body, which can be represented by
photographs, paintings and maps.

Somit können Aufbewahrungsorte wie Zweigstellen, Sektionen, Abteilungen oder Magazine über E27 Site Aussagen über Zusammenhänge und Eigentumsverhältnissen zugeordnet werden. Dazu werden folgende Relationen des CRM verwendet (E27 Site subClassOf E18 Physical Thing):

  • E18 Physical Thing P46 is composed of (forms part of) E18 Physical Thing
  • E18 Physical Thing P52 has current owner (is current owner of) E39 Actor
  • E18 Physical Thing P58 has section definition (defines section) E46 Section Definition

Bestandsnachweis

Beispiel 1: The FRBR family of conceptual models

<http://data.ub.tu-dortmund.de/resource/item/20129967> [
  a frbroo:F5_Item ;
  rdfs:label "A 12726" ;
  ecrm:P52_has_current_owner <http://lobid.org/organisation/DE-290> ;				
  ecrm:P46i_forms_part_of [
	a ecrm:E27_Site ;
	ecrm:P58_has_section_definition [
		a ecrm:E46_Section_Definition ;
		rdfs:label "Second Floor"
	]  ;
	ecrm:P46i_forms_part_of [
		a ecrm:E27_Site ;
		ecrm:P58_has_section_definition [
			a ecrm:E46_Section_Definition ;
			rdfs:label "Central Library"
		] ;
		ecrm:P46i_forms_part_of [
		  a ecrm:E27_Site ;
		  ecrm:P58_has_section_definition [
			a ecrm:E46_Section_Definition ;
			rdfs:label "TU Dortmund, University Library"
		  ] ;
		] ;
	] ;
  ] ;  
] .

Das RDF beschreibt das Exemplar mit der Signatur „A 12726“, welches sich in der Zentralbibliothek der Universitätsbibliothek der TU Dortmund im zweiten Obergeschoß befindet. Die Beschreibung der Zentralbibliothek könnte beispielsweise noch um „Geoinformationen“ ergänzt werden, da es sich um einen von acht Standorten der gesamten Universitätsbibliothek handelt. Diese „Geoinformationen“ sind dann ein mit P53 has former or current location verknüpfter E53 Place.

Bei fortlaufenden Sammelwerken (F18 Serial Work) bzw. beim Spezialfall der Zeitschriften muss man zunächst die Praxis der Aufbewahrung betrachten. Die Exemplare von Zeitschriftenheften liegen — abgesehen von den aktuellsten Heften – meist als Reihe neu gebundener Einheiten vor. Diese Reihen sind in der Regel nicht näher spezifiziert, besitzen allerdings eine gemeinsame Signatur.4
Das nachstehende Diagramm zeigt, neben einem aktuellen Heft in Originalbindung, insbesondere das Ergebnis des Bindeprozesses und den Zusammenhang zur Z9 Storage Unit.
Durch die Transformation der Exemplare zu einem neuen Objekt, wird letzteres zu einem Exemplar eines neuen kumulativen Publication Work. Dieses Publication Work ist dabei ein Teil eines neuen fortlaufenden Sammelwerks in Form einer Reihe.

Items_of_Serial_Works

Der Beschreibung der Bestände verteilt sich jetzt auf zwei Objekte:

  • Die Z9 Storage Unit wird ähnlich wie das F5 Item in Beispiel 1 beschrieben.
  • Die Bestands-Chronologie wird mittels ECPO dem neu entstandenen F18 Serial Work zugeordnet.5

Im folgenden Beispiel wird der Bestandsnachweis einer Zeitschrift anhand eines Teils ihrer Z9 Storage Unit gezeigt, wobei die Chronology nicht mit aufgeführt wird.

Beispiel 2: Bibliotheksdienst
Diese Zeitschrift hat nach obigem Modell zwei Z9 Storage Unit, da Sie in zwei Standorten der Universitätsbibliothek Dortmund angeschafft wurde.

<http://data.ub.tu-dortmund.de/resource/storageunit/ZA_377> [
  a pressoo:Z9_Storage_Unit ;
  rdfs:label "ZA 377" ;
  ecrm:P52_has_current_owner <http://lobid.org/organisation/DE-290> ;	
  ecrm:P46I_forms_part_of [
	a ecrm:E27_Site ;
	ecrm:P58_has_section_definition [
		a ecrm:E46_Section_Definition ;
		rdfs:label "Basement Level 1"
	]  ;
	ecrm:P46I_forms_part_of [
		a ecrm:E27_Site ;
		ecrm:P58_has_section_definition [
			a ecrm:E46_Section_Definition ;
			rdfs:label "Central Library"
		] ;
		ecrm:P46I_forms_part_of [
		  a ecrm:E27_Site ;
		  ecrm:P58_has_section_definition [
			a ecrm:E46_Section_Definition ;
			rdfs:label "TU Dortmund, University Library"
		  ] ;
		] ;
	] ;
  ] ;  
] . 

<http://data.ub.tu-dortmund.de/resource/storageunit/Bibliotheksdienst> [
  a pressoo:Z9_Storage_Unit ;
  rdfs:label "Bibliotheksdienst" ;
  ecrm:P52_has_current_owner <http://lobid.org/organisation/DE-290> ;				
  ecrm:P46I_forms_part_of [
	a ecrm:E27_Site ;
	ecrm:P58_has_section_definition [
		a ecrm:E46_Section_Definition ;
		rdfs:label "R. 501"
	]  ;
	ecrm:P46I_forms_part_of [
		a ecrm:E27_Site ;
		ecrm:P58_has_section_definition [
			a ecrm:E46_Section_Definition ;
			rdfs:label "Bibl. Sozialforschungsstelle"
		] ;
		ecrm:P46I_forms_part_of [
		  a ecrm:E27_Site ;
		  ecrm:P58_has_section_definition [
			a ecrm:E46_Section_Definition ;
			rdfs:label "TU Dortmund, University Library"
		  ] ;
		] ;
	] ;
  ] ;  
] .

Services für die Exemplare
Bestandsnachweise sind eigentlich ohne die Angabe damit verbundener Dienste der Einrichtung in der Linked Open Data Cloud nicht viel wert. Erst durch die mit den Exemplaren verbundenen Services, wie beispielsweise der Ausleihmöglichkeit, werden Mehrwerte angeboten, die durch die bibliographische Beschreibung allein nicht darstellbar sind.

Wie schon im vorigen Beitrag bemerkt, entwickeln sich aktuell im deutschen Bibliothekswesen einige Mikroontologien rund um die Darstellung von Bibliotheksservices und bibliographischen Metadaten im Linked Data Kontext. Um die mit den tatsächlichen Beständen verbundenen Services und Status zu beschreiben, können die in diesem Rahmen entwickelten Ontologien DAIA, DSO und SSSO verwendet werden.

Das folgende Diagramm zeigt die Anbindung der Document Service Ontology an die Z9 Storage Unit mittels DAIA. Hierbei wird vorausgesetzt, dass der Document-Begriff in DSO und in DAIA auch Z9 Storage Unit berücksichtigt6

Z9-DAIA

Die zugeordneten Document Services werden mit der Simple Service Status Ontology beschreiben. Somit sind dann Aussagen wie „Das Exemplar A ist bis zum Datum X nicht ausleihbar.“ möglich.

Beispiel 3: ausleihbares Exemplar mittels daia:availableFor

<http://data.ub.tu-dortmund.de/resource/item/20129967> [
  a frbroo:F5_Item ;
  rdfs:label "A 12726" ;
  daia:availableFor [
    a dso:Loan ;
  ] ;
  ecrm:P52_has_current_owner <http://lobid.org/organisation/DE-290> ;				
  ecrm:P46I_forms_part_of [
	a ecrm:E27_Site ;
	ecrm:P58_has_section_definition [
		a ecrm:E46_Section_Definition ;
		rdfs:label "Second Floor"
	]  ;
        ...
  ] ;  
] .

Beispiel 4: Zeitschriftenbestand für die Präsenznutzung und Fernleihe

<http://data.ub.tu-dortmund.de/resource/storageunit/ZA_377> [
  a pressoo:Z9_Storage_Unit ;
  rdfs:label "ZA 377" ;
  daia:unavailableFor [
    a dso:Loan ;
  ] ;
  daia:availableFor [
    a dso:Presenation ;
  ] ;
  daia:availableFor [
    a dso:Interloan;
  ] ;
  ecrm:P52_has_current_owner <http://lobid.org/organisation/DE-290> ;	
  ecrm:P46I_forms_part_of [
	a ecrm:E27_Site ;
	ecrm:P58_has_section_definition [
		a ecrm:E46_Section_Definition ;
		rdfs:label "Basement Level 1"
	]  ;
        ...
  ] ;  
] .

Fazit
Es konnte gezeigt werden, dass ohne ein neues Vokabular und mit bereits bestehenden Ontologien ausgereifte Aussagen über Bestände gemacht werden können.
Übrigens ließen sich auch Erwerbungsinformationen durch die Modell-Familie des CIDOC CRM beschreiben. Als einfachste Variante nehme man für das Erwerbungsereignis das Konzept E8 Acquisition Event und beschreibe es mittels EDIFACT-Daten als E31 Document.

  1. Wiki der DINI-KIM-AG []
  2. EDINA is the Jisc-designated national data centre at the University of Edinburgh. []
  3. Der Katalog des Bibliotheksverbunds NRW wird vom
    Hochschulbibliothekszentrum NRW (hbz) betrieben und entsteht durch eine gemeinsame Katalogisierung der Verbundbibliotheken in ein zentrales
    Bibliothekssystem (ILS). Die in diesem System erfassten Daten werden anschließend in den Lokalsystemen repliziert. []
  4. Bei „einfachen“ Reihen oder Serien handelt es sich bei den Bänden in der Regel um Objekte in „klassischer Buchform“, die nicht in regelmäßigen Abständen zu neuen Einheiten gebunden werden. Sie werden daher aus dieser Betrachtung herausgelassen. []
  5. vgl. auch „PRESSoo und ECPO – Zwei weitere Ontologien zur Beschreibung von fortlaufenden Sammelwerken“ []
  6. In der Spezifikation zu DSO heißt es: „The set of documents is not limited to a specific class[…]“. Daher ist hier die Annahme berechtigt. Bei DAIA müsste die Spezifikation dahingehend erweitert werden, da hier nur frbr:items verwendet werden. []