[DHd-blog] Graphik im digitalen Raum (1/3): Institutionen und Inhaltserschließung

[德语国家数字人文协会DHd-blog网站消息]

von Martin de la Iglesia und Julia Rössel

Diese dreiteilige Serie von Blogposts präsentiert Gedanken und Thesen, die wir für eine Session im Rahmen des #arthistoCamp am 26. 3. 2019 in Göttingen im Vorfeld des Kunsthistorikertags zusammengetragen und dort diskutiert haben. Allen Teilnehmerinnen und Teilnehmern dieser Session sei an dieser Stelle nochmals herzlich gedankt. Ziel dieser Beiträge ist es, die angesprochenen Themen noch etwas zu vertiefen.

Im ersten Teil befassen wir uns mit dem institutionellen Kontext, in dem Graphik digitalisiert wird, und mit Iconclass als Werkzeug der Sacherschließung.

Digitalisierung als institutionelles Problem

Über Graphik im digitalen Raum sollte nicht losgelöst von ihrem Kontext in der materiellen Welt nachgedacht werden. Als Bildobjekte auf Papier, die mithilfe so unterschiedlicher Technologien wie Zeichnung, Kupferstich oder Fotografie ihre Umsetzung gefunden haben, wurden und werden sie in graphischen Sammlungen von Museen, Bibliotheken o.ä. versammelt und geordnet. Dort haben auch die auf Graphik basierenden digitalen Objekte, um die es im Folgenden gehen wird, in der Regel ihren Ursprung. Natürlich unterliegen solche Institutionen selbst dem historischen und konzeptionellen Wandel, der sich nicht zuletzt in der Herangehensweise an die Aufgabe der Digitalisierung niederschlägt.

Ein wichtiger Punkt im Konzept der Institution Museum seit dem 20. Jahrhundert ist seine Konzeption als Ort, an dem alles auf das Erleben des Originals ausgerichtet ist. Graphische Sammlungen verfügen über Studiensäle, in denen interessierte Personen papiernen Kunstwerken näher kommen können als den Gemälden in den Galerieräumen. Sollte nicht dieses Erleben gepflegt und befördert werden? Die meisten Sammlungen können ohnehin nicht vollständig digitalisiert werden. Reicht es also nicht, wenn die Institution Besucherinnen und Besucher mit einer schönen Website und einer Auswahl ihrer Glanzstücke an ihren physischen Standort lockt? Eingehendere Recherche ist schließlich vor Ort noch immer am besten möglich, in Katalogen und im Austausch mit Mitarbeiterinnen und Mitarbeitern. Beispielprodukt solcher Ideen wäre etwa das Euploos-Projekt (http://euploos.uffizi.it/catalogo-euploos.php) der Uffizien, bei dem es sich eigentlich um einen klassischen Sammlungskatalog handelt. Eine hohe Erschließungstiefe versteht sich hier von selbst, man möchte möglichst alle zum Zeitpunkt der Erstellung der Datensätze vorhandenen Informationen präsentieren – besser recherchierbar werden sie dadurch leider nicht: Davon abgesehen, dass die Recherche nur auf Italienisch möglich ist, stehen mit Hersteller (“Autore”), Inventarnummer und Darstellung/Motiv (“Soggetto Opera”) lediglich drei für die Suche indexierte Felder zur Verfügung. Als Nutzerin oder Nutzer muss mir eine dieser Informationen also bekannt sein, die richtige Schreibweise wird dank Indexlisten, aus denen Autovervollständigungsvorschläge generiert werden, gewährleistet. Zum Beispiel finde ich die Vorzeichnung für den Tondo Bartolini von Filippo Lippi auch über das Stichwort “Tondo Bartolini” oder “Madonna” (http://euploos.uffizi.it/scheda-catalogo.php?invn=191+E).

Screenshot des erwähnten Datensatzes im euploos-Katalog

Wenn ich mich aber allgemeiner für Silberstiftzeichnungen interessiere, werde ich mit der Suche “punta d’argento” nicht fündig, obwohl die Angabe in exakt dieser Schreibweise im Datensatz vorhanden ist. Ebenso erfolglos ist die Suche nach Lugt-Nummern, welche Sammlermarken verzeichnen und somit ein Hilfsmittel für Fragen der Provenienzforschung wären. Im Anschluss an einen längeren deskriptiven Text sind Ausstellungspräsenzen und Literaturangaben zu der Zeichnung aufgelistet – auch sie sind leider nicht recherchierbar. Die Bilder sind bedauerlicherweise mit einem großen Wasserzeichen versehen und sind dadurch kaum mehr als Platzhalter, sodass der/die Nutzer/-in die im Text gemachten Angaben nicht oder nur schwer nachvollziehen kann.

Im Grunde haben wir es hier mit einer Remediation im Sinne Bolter/Grusins (Jay David Bolter / Richard Grusin: Remediation – Understanding New Media, 1999) zu tun, welche die statische mediale Struktur eines gedruckten Sammlungskatalogs auf den Bildschirm projiziert. Jedoch kommt der digitalen Repräsentation dabei der Vorzug des gedruckten Katalogs abhanden, als vertrauenswürdige, belastbare Quelle zu gelten. Eine Online-Datenbank ist stets dem Verdacht der vergleichsweise geringeren Datentransparenz (wer hat welche Aussagen getroffen?) und Datenintegrität (wurden die angezeigten Daten jemals geändert?) ausgesetzt.

Mit einer solchen Remediation geht die Vorstellung einher, einmal erstellte Datensätze eigentlich nicht mehr oder nur geringfügig modifizieren oder pflegen zu müssen. “Do it once and do it right” (Peter Fuhring in seiner Keynote auf der Tagung “Das Sammeln von Graphik in historischer Perspektive”, Wolfenbüttel 2016). Man produziert lieber wenige, aber dafür qualitätvolle Daten. Aber Datenqualität aus Sicht von Forscherinnen und Forschern ist nicht gleich Datenqualität aus Sicht von Computern. Eine der Qualitätsdimensionen für Daten ist z.B. die Korrektheit. Eine Graphikforscherin oder ein Graphikforscher erkennt über die Ansicht der Reproduktion, wenn ein Kupferstich fälschlicherweise im Datensatz mit dem Objekttyp Zeichnung beschrieben ist. Für den Computer ist diese Angabe formal korrekt, weil das Feld mit einem zulässigen im Vokabular hinterlegten String belegt ist.

Seit dem Einzug von Computern in Museumsgebäude trat neben die Vorstellung des Museums als Erlebnisort die Vorstellung des Museums als Datenbank und des musealen Objektes als Informationsobjekt. Die vollständige elektronische Verzeichnung oder Katalogisierung der Objekte würde also auch eine umfassende Nutzung der in der Institution versammelten Informationen bedeuten.

Für den Anfang hieße hier die Devise gerade nicht “do it once and do it right”, sondern im Gegenteil “quick and dirty” – idealerweise durchlaufen die erzeugten Daten ohnehin immer wieder Qualitätssicherungsprozesse, bei denen sie aktualisiert und angereichert werden können. Das Museum als Datenbank implementiert digitale Infrastrukturen in möglichst alle seine Arbeitsprozesse und digitalisiert nicht nur zum Zwecke der Publikation. Publikation bedeutet dann, dass Informationen im Internet in ihren verschiedenen Facetten abrufbar sein müssen (s.u. “Metadaten als Forschungsgrundlage?”). Digitale Objekte würden von den Museen als institutionelle Produkte verstanden, welche vielfältig genutzt werden können und gepflegt werden müssen, um auch eine zukünftige Nutzung zu gewährleisten. Wenn das Museum eine Datenbank sein soll, multiplizieren sich seine Zugänge, es verlängert sich in den digitalen Raum.

Wenn sich also Institutionen für die Digitalisierung ihrer Bestände entscheiden, so sollten sie diesen Vorgang aus unserer Sicht nicht als ein oder mehrere Projekte, sondern als langfristigen und umfassenden Transformationsprozess begreifen, der auch eine Veränderung von Denkweisen und Arbeitsprozessen mit sich bringt, die über das bislang Übliche hinausreichen oder womöglich mit ihm brechen.

Zu den Museen und ähnlichen datenerzeugenden Institutionen gesellt sich im Feld der Graphik im digitalen Raum eine weitere Art von Akteur, die vor andere institutionelle Herausforderungen gestellt ist, nämlich Portale, Meta-Suchmaschinen und Aggregatoren. Für den deutschsprachigen Raum ist hier in erster Linie das Graphikportal (https://www.graphikportal.org) zu nennen, aber auch weniger graphikspezifische Angebote wie Europeana (https://www.europeana.eu) oder die Deutsche Digitale Bibliothek (https://www.deutsche-digitale-bibliothek.de/) zählen zu dieser Kategorie. Diese Portale bieten eine Suche über mehrere verschiedene Graphikbestände zugleich an und präsentieren die Treffer in einer einheitlichen Ansicht. Um diese Einheitlichkeit zu gewährleisten, wird eine von zwei Strategien (oder eine Kombination aus beiden) verfolgt: Entweder werden die heterogenen Daten aus den einzelnen datengebenden Institutionen durch Mappings in ein einheitliches Format überführt, oder es werden von vorneherein nur standardkonforme Daten akzeptiert. Beides hat im besten Fall eine standardisierende Wirkung auf die Erschließungspraxis an den datenliefernden Einrichtungen. Die Zusammenarbeit zwischen Datengeberin und Aggregator kann dabei unterschiedlichste Formen annehmen, von einem eng vernetzten Konsortium bis hin zu einem einseitigen Harvesting der Daten (Pull- statt Push-Mechanismus).

Die Standardisierung von digitalen Prozessen und Informationen ist nach wie vor problematisch und hat für Mitarbeiter/-innen wie Nutzer/-innen sehr praktische Auswirkungen bei der Recherche nach Informationen zur Druckgraphik, wie im Folgenden zu zeigen sein wird. Dies zeigt sich im Bereich der inhaltlichen Erschließung an dem schon seit Langem bestehenden Mittel Iconclass.

“I saw an angel, of that I’m sure” – Inhaltserschließung per Iconclass

In vielleicht noch höherem Maße als andere Bildkünste neigt die Graphik – vor allem die Druckgraphik, aber auch z.B. skizzierende oder dokumentierende Handzeichnung – zu einer dichten Akkumulation von distinkten Elementen innerhalb eines Bildes. Man denke etwa an naturwissenschaftliche Illustrationen, die auf engem Raum eine Vielzahl z.B. verschiedener Tierarten abbilden; oder aber an das vielleicht berühmteste druckgraphische “Wimmelbild”, Albrecht Dürers Kupferstich “Melencolia I” mit seiner rätselhaften Zusammenstellung von Gegenständen und Figuren. Gerade weil die Interpretation solcher Objektkonfigurationen als Ganzes oft uneindeutig ist, kommt zunächst einmal der bloßen Aufzählung der einzelnen Bildelemente eine besondere Bedeutung bei der Inhaltserschließung im Rahmen der Graphikinventarisierung zu. Schließlich ist auch die Beschäftigung mit einzelnen Gegenständen und ihrer bildlichen Repräsentationen, (zunächst) unabhängig von ihrem Bildzusammenhang, ein legitimes Forschungsanliegen.

Iconclass (http://www.iconclass.nl) ist ein Klassifikationssystem, durch das Bildinhalte mittels Notationen erfasst werden können. Als in der Kunstgeschichte verwurzeltes  System ist Iconclass allgemein bekannt, wenn auch in der Erschließungspraxis nicht allzu weit verbreitet. Es besteht aus 10 Hauptklassen wie “1 · Religion and Magic”, die sich in weiteren Ebenen auffächern, so dass Notationen vergeben werden können wie etwa die siebenstellige – also 7 Hierarchieebenen tiefe – “11F2412” (“Mary pierced by seven swords”). Diese Notation kann durch weitere Qualifikatoren oder Freitextzeichenketten (z.B. Personennamen) noch erweitert werden. Aber auch weniger spezifische (also kürzere) Notationen sind legitim. Üblicherweise werden für ein Bild mehrere Iconclass-Notationen vergeben, um zumindest die wichtigsten Bildelemente zu erfassen.

In der Praxis zeigen sich große Unterschiede in der Anwendung von Iconclass. Betrachten wir als Beispiel erneut Dürers Melencolia. Im Datensatz der Fotothek der Bibliotheca Hertziana (http://foto.biblhertz.it/exist/foto/obj08006572) sind diesem Bild 4 Iconclass-Notationen zugeordnet:

11 G [angels]23 U 22 [hourglass]46 B 33 11 [scales]46 E 52 1 [bell ~ acoustic signalling]

Für dasselbe Bild sind jedoch im Virtuellen Kupferstichkabinett (VKK, http://kk.haum-bs.de/?id=a-duerer-wb3-0122) ganze 8 Notationen angegeben:

92D1916 Amoretten, Putten; amores, amoretti, putti;46B3311 Waage (mit Waagschalen);34B11 Hund;47D8(HAMMER) Werkzeuge, Hilfsmittel, Geräte für Handwerk und Industrie: Hammer;49D5111 Zirkel;47D8(PLANE) Werkzeuge, Hilfsmittel, Geräte für Gewerbe und Industrie: Hobel;47D8(SAW) Werkzeuge, Hilfsmittel, Geräte für Handwerk und Industrie: Säge;32A140 Ripa: Malenconico (per la terra), Malinconia

Albrecht Dürers “Melencolia I” aus dem Herzog Anton Ulrich-Museum Braunschweig.

Dabei wurden im Falle des Braunschweiger Exemplars nicht einfach lediglich mehr Bildinhalte beschrieben als im römischen: So erfasst das letztere die Sanduhr und die Glocke, welche in ersterem unberücksichtigt bleiben. Unklar ist, ob mit “11G” (Hertziana) nur die rechte und mit “92D1916” (VKK) nur die linke der beiden geflügelten humanoiden Gestalten gemeint ist. Hier zeigt sich eine besondere Herausforderung von Iconclass: Es ist so aufgebaut, dass ähnlich aussehende Bildelemente (so wie hier die beiden menschenähnlichen Wesen mit Flügeln) zwei ganz unterschiedlichen Klassen zugeordnet werden können – je nachdem ob sie der christlichen (Klasse 11) oder der griechisch-antiken Mythologie (Klasse 9) zugehörig sind – und der/die Iconclass-Anwender/-in sich für eine davon entscheiden muss.

Eine Alternative zu Iconclass und anderen Klassifikationen ist die (freie) Verschlagwortung, welche interessanterweise auch im VKK angewendet wird. Im Datensatz der “Melencolia” finden sich hier die folgenden Schlagwörter:

„Allegorie; Buch; Fledermaus; Flügel; Frau; Hobel; Hund; Kugel; Melancholie; Polyeder; Putto; Sägewerk; Schlüssel; Sanduhr; Temperament; Waage; Zahlentafel; Zirkel“

Das Problem der Unsicherheit, ob es sich bei der rechten geflügelten Figur um einen (christlichen) Engel handelt, ist hier durch die Vergabe der beiden Schlagwörter “Flügel” und “Frau” gelöst worden. Auch sind durch die Schlagwörter Elemente erfasst, die von den 8 Iconclass-Notationen nicht berücksichtigt werden, wie z.B. der Polyeder oder die Zahlentafel. Umgekehrt sind hingegen, mit Ausnahme des Hammers, alle 8 durch Iconclass erfassten Bildinhalte auch durch Schlagwörter repräsentiert. Es drängen sich also geradezu die Fragen auf, warum im VKK die Arbeit der Inhaltserschließung doppelt geleistet wurde, und ob man nicht gänzlich auf Iconclass zugunsten einer freien Verschlagwortung verzichten könnte.

Dafür spricht die bereits angedeutete Komplexität von Iconclass. Durch dessen insgesamt ca. 1,3 Millionen Notationen (http://www.iconclass.org/help/lod) ist es für die Anwenderinnen und Anwender stets eine anspruchsvolle Aufgabe, durch die Hierarchieebenen zu navigieren und die jeweils passendste Klasse zu ermitteln. Es ist also im Vergleich zur freien Verschlagwortung ein aufwändiges Erschließungsverfahren. Aber auch für die Datenbanknutzerinnen und -nutzer kämen natürlichsprachliche Schlagwörter eher deren Sprachgebrauch nahe als die Iconclass-Notationen, so dass der Recherchevorgang durch eine derartige Schlagwortsuche intuitiver wäre.

Bei dieser Gegenüberstellung von Iconclass und freier Verschlagwortung ist jedoch zu beachten, dass Iconclass mitnichten ein reines Klassifikationssystem ist, sondern, wie bereits erwähnt, die Möglichkeit der Kombination von Notationen mit Freitextkomponenten vorsieht. In unserem Beispieldatensatz gibt es mehrere dieser Hybridnotationen, z.B. “47D8(PLANE)”. Der vordere Teil “47D8” steht dabei für die Klasse “tools, aids, implements ~ crafts and industries”, und “PLANE” für den Namen des betreffenden Werkzeugs, hier also den Hobel. Durch solche Klammerzusätze werden die Vorteile eines Klassifikationssystems geradezu wieder zunichtegemacht, denn für die Suche nach z.B. Abbildungen eines bestimmten Werkzeugs muss die oder der Recherchierende die genaue Form des in der jeweiligen Datenbank vergebenen Zusatzes vorausahnen und wissen, dass in diesem Fall die englische Sprache verwendet wird und “Hobel” auf Englisch “plane” heißt. Ein gutes Retrievalsystem könnte diese Sprachabhängigkeit durch z.B. Synonymlisten umgehen. Im VKK führt eine Suche nach “47d8 hobel” zu den gewünschten Ergebnissen (allerdings nur solange man nicht die Suche explizit auf das Iconclass-Feld einschränkt), da die deutsche Übersetzung den Notationen beigegeben ist; z.B. “47D8(PLANE) Werkzeuge, Hilfsmittel, Geräte für Gewerbe und Industrie: Hobel”.

Bei aller Kritik ist jedoch nicht von der Hand zu weisen, dass die Iconclass-Notationen (abgesehen von den Klammerzusätzen) grundsätzlich den Vorteil der Sprachunabhängigkeit haben. Als Nutzerin oder Nutzer muss ich nicht wissen, was “Werkzeug” auf z.B. Englisch oder Niederländisch heißt, sobald ich erst einmal den alphanumerischen Code für die Klasse der Werkzeuge (47D8) ermittelt habe. Iconclass ist also international sowohl in der Erschließung als auch in der Recherche anwendbar.  Entsprechend existieren z.B. auch englisch- (http://www.emblems.arts.gla.ac.uk/french/iconclass-browse.php) oder französischsprachige (http://www.bvh.univ-tours.fr/Iconclass_browse.asp) Iconclass-Implementierungen.

Darüber hinaus sind Notationen umso vorteilhafter gegenüber natürlichsprachlichen Benennungen, je abstrakter und umfangreicher das gesuchte Konzept ist. Im Melencolia-Beispiel ist die Notation “92D1916” leichter handhabbar als die verbale Umschreibung “cupids: ‚amores‘, ‚amoretti‘, ‚putti’”: Die Suche nach bildlichen Repräsentationen dieses Konzepts gestaltet sich mit Iconclass komfortabler, da man nicht mit einer Kombination aus mehreren Suchwörtern wie ‘cupids + amores + amoretti + putti’ suchen muss, ganz zu schweigen von möglichen Synonymen und sprachlichen Varianten.

Iconclass kann also durchaus für Graphikdatenbanken ein sinnvolles Inhaltserschließungs- und Recherchewerkzeug sein. Die in der Praxis auftretenden Probleme mit Iconclass, die hier skizziert wurden, liegen nicht am Klassifikationssystem an sich, sondern zum einen an der unterschiedlichen Anwendung des Regelwerks an unterschiedlichen Institutionen, und zum anderen an den oft mangelhaften Retrievalsystemen. Ein verstärkter Austausch zwischen den Anwenderinstitutionen könnte in beiden Punkten Abhilfe schaffen. Durch einen höheren Grad an Standardisierung könnte das Potenzial besser ausgeschöpft werden, das Iconclass durch seine Vormachtstellung als Klassifikation zur kunsthistorischen Inhaltserschließung innehat.

Teil 2 erscheint am Mittwoch, 26. Juni.

Martin de la Iglesia ist Wissenschaftlicher Mitarbeiter im Projekt “Kommentierte digitale Edition der Reise- und Sammlungsbeschreibungen Philipp Hainhofers (1578-1647)” an der Herzog August Bibliothek Wolfenbüttel sowie Promotionsstudent im Fach Kunstgeschichte an der Universität Heidelberg.

Julia Rössel ist Wissenschaftliche Mitarbeiterin im Projekt “Kupferstichkabinett Online”, das ebenfalls an der HAB angesiedelt ist, und befasst sich im Rahmen ihrer Promotion mit Transformationsprozessen bei der Digitalisierung von Graphischen Sammlungen.