[DHd-blog] DARIAH-DE Lizenzierungsworkshop vom 11. bis 13. Mai 2015

[德语国家数字人文协会DHd-blog网站消息]

Vom 11. bis 13. Mai 2015 fanden im Tagungszentrum an der Sternwarte in Göttingen der DARIAH-DE Workshop „Store it, share it, use it. Lizenzierung digitaler Forschungsdaten in den Sprach- und Literaturwissenschaften“ und das 7. TextGrid Nutzertreffen „Archivieren und Publizieren mit TextGrid“ statt.

Aspekte zur Lizenzierung digitaler Forschungsdaten standen am ersten und am zweiten Tag vormittags im Mittelpunkt. Für digitale Editionen geisteswissenschaftlicher Forschungsvorhaben bieten sich heute verschiedene Wege der elektronischen Publikation und Präsentation ihrer Forschungsdaten. Aber auch im digitalen Raum gilt es, Urheber-, Nutzungs- und Leistungsschutzrechte zu beachten. Der erste Vortrag von Paul Klimpel (iRights) ging auf die aktuelle Rechtslage bei der Lizenzierung geisteswissenschaftlicher Daten ein.

So differenziert die Rechtslage im Hinblick auf Lizenzen und den Schutz geistigen Eigentums aktuell nicht zwischen digitaler und „analoger“ Provenienz. Das Urheberrecht ist nach wie vor an die Person gebunden, die ein Werk, zum Beispiel eine wissenschaftliche Monographie, erstellt hat. Was allerdings nicht vom Urheberrecht erfasst wird, sind die Metadaten, die bei der Produktion des Werkes entstehen können oder die als Basis für die Erstellung des Werkes gedient haben, zum Beispiel Bestands- oder Signaturangaben zu Büchern, auch wenn diese unter einem nicht unbeträchtlichen Aufwand produziert wurden.

Das eigentliche Ergebnis dieser geistigen Arbeit im rechtlichen Sinne eines Werkes ist, sobald es digital oder analog publiziert oder maschinell erfasst wird, geschützt durch das sogenannte Leistungsschutzrecht, welches bei derjenigen Institution liegt, die für die Leistung des Publizierens oder der maschinellen Erfassung verantwortlich war. So können Leistungsschutzrechte auch dann entstehen, wenn das aufgenommene, eingespielte oder publizierte Werk bereits gemeinfrei ist.

Im Kontext eines wissenschaftlichen Austausches von Wissen und Erkenntnisgewinnen unter den Prinzipien der Offenheit, der Transparenz, der Nachvollziehbarkeit und des freien Diskurses sind, urheberrechtlich betrachtet, die wissenschaftliche Lehre und die daraus entwickelten Theorien als gemeinfrei anzusehen. Diese Anschauung spiegelt sich im digitalen Raum vor allem in den Bemühungen um Open Access und Open Source Lizenzen wider.

Eines der Ergebnisse der DARIAH-Forschung im Kontext von Urheber- und Nutzungsrechten wird in Kürze in den DARIAH-DE Working Papers veröffentlicht: Paul Klimpel, John H. Weitzmann: Forschen in der digitalen Welt. Juristische Handreichung für die Geisteswissenschaften

Anschließend wurden in den folgenden Vorträgen Erfahrungen mit Copyright und Lizenzierung anhand zweier konkreter Projekte näher beschrieben und lebhaft diskutiert. Die jeweilige spezielle Rechtesituation ergibt sich entweder im Zuge einer Digitalisierung von Forschungsdaten aus der empirischen Komplexität der Datensätze, welche die Grundlage des Forschungsprojekts bilden, oder hinsichtlich einer Zentralisierung von Datenbeständen und Digitalisaten, die bereits mit unterschiedlichen Lizenzformen ausgezeichnet sind, da sie aus verschiedenen Institutionen stammen, welche die Digitalisierung und Lizenzvergabe vorgenommen hat. Zum einen trug Christian Prager (Rheinische Friedrich-Wilhelms-Universität Bonn) über das Projekt „Textdatenbank und Wörterbuch des Klassischen Maya“ vor. Die Maya-Kultur existierte dem aktuellen Forschungsstand nach von etwa 300 v. Chr. bis 1500 n. Chr. und erstreckte sich über das Gebiet der Yucatán-Halbinsel im heutigen Mexiko mit einem Netz von Stadtstaaten, welche in dynastischer Form von einer höfischen Elite regiert wurde. Die Schrift- und Bildträger dieser Kultur sind Ausdruck der Botschaften der herrschenden Oberschicht. Insgesamt existieren momentan über 500 Fundstätten mit Textträgern, ihre Anzahl beläuft sich auf mindestens 10.000 Einzelobjekte und zeitlich erstrecken sich diese über den ganzen historischen Wirkungszeitraum dieser Hochkultur. Oftmals sind die Text- und Bildträger an den von den Maya hinterlassenen Bauten zu finden.

Zum anderen berichtete Torsten Schaßan (Herzog August Bibliothek Wolfenbüttel) über das Projekt ‚Europeana Regia‘, einer digitalen und kooperativen Bibliothek von Manuskripten des europäischen Mittelalters und der Renaissance.

Neben der Standardisierung unterschiedlicher Metadaten war die Rechtesituation der Sammlungen von Relevanz, da die rechtliche Ausgangsbasis bei den Projektpartnern ähnlich heterogen war wie bei den Metadatenstandards. Die angestrebte Creative Commons Zero-Lizenz (CC0) konnte beispielsweise bei den angelieferten Datenbeständen der Herzog August Bibliothek nicht erfüllt werden, da diese von der internen Rechtedeklaration der Institution nicht gedeckt war. Momentan sieht die Rechteregelung der HAB in Wolfenbüttel eine Creative Commons Namensnennung-Weitergabe unter gleichen Bedingungen 3.0 für Deutschland Lizenz (CC BY-SA) vor. Die Bayerische Staatsbibliothek (BSB) sieht für die Digitalisate, welche sie zur Verfügung stellt rechtlich vor, dass jegliche kommerzielle Nachnutzung genehmigungs- und gebührenpflichtig ist. Dementsprechend ist für die Digitalisate der BSB eine Creative Commons Namensnennung – Nicht-kommerziell – Weitergabe unter gleichen Bedingungen 4.0 für Deutschland Lizenz (CC BY-NC-SA) hinterlegt.

Für die Datenbanken der Manuscripta Mediaevalia, der Ort, an dem die Handschriftenbeschreibungen gesammelt und veröffentlicht werden, gilt § 53 UrhG, welcher sogenannte „Privatkopien“ zum wissenschaftlichen und privaten Gebrauch erlaubt, jedoch keine kommerzielle Nutzung dieser vervielfältigten Daten vorsieht.

Angesichts dieser Lage ergibt sich im Projekt Europeana Regia eine komplexe Rechtesituation hinsichtlich der Digitalisate, Metadaten und Sammlungsbeschreibungen, welche die Datenbestände des Projekts konstituieren. Daraus erwachsen mehrere Fragestellungen für die Projektträger, beispielsweise, ob sie alle Verwertungsrechte an den Projektergebnissen besitzen oder nicht.

Am zweiten Veranstaltungstag wurden von Wibke Kolbmann (Deutsches Archäologisches Institut) drei Tools auf der Basis der Creative Commons Lizenzen vorgestellt, die GeisteswissenschaftlerInnen bei Lizenzierungsentscheidungen für ihre Forschungsdaten unterstützen können.

Zuerst wurden die Urheberrechtslizenzen vorgestellt, die unter Creative Commons 4.0 zusammengefasst und auf der CC-Webseite anhand eines „Licence Choose Tools“ (http://creativecommons.org/choose/) ausgewählt werden können. Creative Commons Lizenzen richten sich an Urheber, die Nutzern freiwillig erweiterte Vervielfältigungs- und Verbreitungsrechte an ihren Werken einräumen wollen und sind weltweit gültig. Die Lizenztexte werden von Creative Commons in drei Varianten angeboten, so dass sie für Juristen, für Laien und für Maschinen lesbar sind. Die letzte Variante auf der Basis der Creative Commons Rights Expression language (CC Rel) lässt sich somit benutzerfreundlich in den Quellcode unterschiedlicher Programmier- und Scriptsprachen einbauen und gewährleistet eine sichere und nachweisbare Referenzierung der Rechte an digitalen Objekte und Digitalisaten. Anhand von HTML/XHTML, TEI XML und EDM XML wurden während des Vortrags die rechtlichen Nachweise der Creative Commons Lizenzen im Quellcode exemplifiziert.

Das zweite vorgestellte Tool, welches bei der Entscheidungsfindung von Lizenzen zur Hilfe genommen werden kann, ist das Licensing Decision Tool des web2rights OER IPR Support Project (http://www.web2rights.com/OERIPRSupport/index.html). Anhand eines Flussdiagramms kann die rechtliche Offenheit des zu lizenzierenden Werkes bestimmt werden. Aufgrund von Informationen und Fragen, die seitens des jeweiligen Projektes definiert werden, können Interessierte und FachwissenschaftlerInnen eine Creative Commons Lizenz auswählen, die am Besten zur spezifischen rechtlichen Situation und dem entsprechenden Werk passt. In dieser Hinsicht verfolgt das Licensing Decision Tool den Ansatz, den Prozess der Lizenzvergabe transparenter zu gestalten und zu visualisieren.

Das letzte vorgestellte Lizenzierungswerkzeug war der Public Domain Calculator (http://outofcopyright.eu/), welcher im Projekt Europeana im Kontext des internen Licensing Frameworks entwickelt wurde. Die Kerntätigkeiten des Letzteren bestehen in der Klärung der Rechtslage und Empfehlungen für Datenanbieter im Hinblick auf die Lizenzierung ihrer Daten für das gesamte Projekt Europeana. Der Public Domain Calculator dient als ein Werkzeug zur Bestimmung mehrerer lizenzrechtlicher Fragen. Etwa, ob die Schutzfristen für ein Werk ausgelaufen sind, oder ob anderweitige Fakten vorliegen, welche die Veröffentlichung eines Werkes als gemeinfrei ermöglichen. Weiterhin kann anhand von eingegebenen Informationen bestimmt werden, ob ein neu entstandenes Werk als gemeinfrei veröffentlicht werden kann. Das Tool wurde entwickelt in einer Kooperation von Knowledgeland (KL) und dem Institute of Information Law (IViR)

Die Vorträge des Lizenzierungsworkshops zeigten, dass sich die Komplexität der Rechtslage in Kombination mit heterogenen Datenbeständen erhöht und daher ein Bedarf seitens der FachwissenschaftlerInnen an Informationen zum Thema Lizenzierung und bei der Veröffentlichung ihrer digitalen Forschungsdaten und Monographien besteht. Weiterhin boten die Vorträge unterschiedliche Perspektiven, wie mit der konkreten Rechtslage eines Forschungsprojektes umgegangen werden kann. Auch wenn von einer Vielfalt von rechtlichen Situationen bei Forschungsprojekten und länderübergreifenden Kooperationen ausgegangen werden muss, zeigte sich seitens der Vortragenden und des Plenums dennoch der Wunsch nach einem akademischen freien Wissensaustausch, dem mithilfe von Lizenzierungsmodellen wie Open Access, Public Domain und Creative Commons entsprochen werden soll.

Das 7. TextGrid Nutzertreffen ‚Archivieren und Publizieren mit TextGrid‘ schloss am selben Nachmittag an und begann nach einer kurzen Begrüßung durch Wolfram Horstmann (Niedersächsische Staats- und Universitätsbibliothek Göttingen) mit einer Einführung in TextGrid, moderiert von Oliver Schmid (Technische Universität Darmstadt), der einen Überblick über die wichtigsten Werkzeuge des TextGridLab und deren grundlegende Funktionen gab.

Parallel zur Einführung fand ein Workshop mit dem Thema „Publizieren mit TextGrid“ statt, an dem NutzerInnen teilnahmen, die bereits erste Erfahrungen mit TextGrid sammeln konnten und spezifische Fragestellungen im Kontext des Publizierens hatten. Philipp Vanscheidt (Technische Universität Darmstadt) stand den Nutzern zur Seite und beantwortete alle vorgebrachten Fragen.

Anschließend kamen die TeilnehmerInnen im TextGrid Café wieder zusammen. Dort wurden Poster der einzelnen Forschungseinrichtungen und -projekte präsentiert und gleichzeitig bot die entspannte Atmosphäre den idealen Anlass, sich auszutauschen und über die gemeinsamen Erfahrungen mit TextGrid zu diskutieren.

Danach folgten die Präsentationen über das TextGrid Repository von Stefan Funk und Maximilian Brodhun (beide von der Niedersächsischen Staats- und Universitätsbibliothek Göttingen) sowie von Oliver Schmid (Technische Universität Darmstadt) und Elmar Mittler (Niedersächsische Staats- und Universitätsbibliothek Göttingen) über die Erfahrungen mit TextGrid im akademischen Unterricht. Des Weiteren sprachen Ole Fischer und Arno Michalowski (Institut für Geschichte der Medizin der Robert Bosch Stiftung, Stuttgart) über „Ein Pilotprojekt zur Digitalisierung von Hahnemann-Handschriften am Beispiel eines Krankenjournals.“ Dabei handelt es sich um die Digitalisierung des Nachlasses Samuel Hahnemanns, des Begründers der Homöopathie. Dieser Datenbestand befindet sich im Archiv des Instituts für Geschichte der Medizin der Robert Bosch Stiftung (IGM) und umfasst vor allem die Krankenjournale Hahnemanns und eine umfangreiche Korrespondenz. Dieses für die Homöopathiegeschichte einmalige Quellenkorpus dokumentiert eine über 40-jährige zusammenhängende Praxistätigkeit für den Zeitraum von 1800 bis 1843. Seit 1989 werden am IGM im Rahmen wissenschaftlicher Arbeiten einzelne Patientengeschichten, Briefwechsel und komplette Krankenjournale nach einheitlichen Editionsrichtlinien transkribiert. Diesen in verschiedenen Word-Formaten vorliegenden Transkriptionen gilt das Interesse des Pilotprojektes. Im vorgestellten Projekt soll sowohl ein Metadaten-Schema zur Erfassung der Textdaten erarbeitet als auch perspektivisch die Publikation und die Archivierung der digitalen Repräsentation ins Auge gefasst werden. Den Abschluss des ersten TextGrid-Tages bildete der Vortrag von Gottfried Reeg (Freie Universität Berlin) über das wissenschaftliche Arbeiten mit TUSTEP.

Den Anfang des zweiten TextGrid Tages machten Judith Lange (Berlin-Brandenburgische Akademie der Wissenschaften) und Philipp Vanscheidt (Technische Universität Darmstadt) mit ihrem Workshop „Veröffentlichungen mit CSS anpassen“.

Zunächst wurde ein Nutzungsszenario vorgestellt, in dem Digitale Objekte, Transkriptionen und Faksimiles, an denen von einer Forschergruppe kooperativ gearbeitet wurde, in eine virtuelle Forschungsumgebung, in diesem Falle TextGrid, eingespielt wird. Innerhalb der virtuellen Forschungsumgebung können die eingespeisten Daten unter anderem dann angereichert und transformiert, verschiedene Objekte (z.B. Querverweise) verwaltet und Faksimiles und Transkriptionen verknüpft werden. Im TextGrid Repository werden die Forschungsdaten langfristig verfügbar gemacht. Eine Nachnutzung der Forschungsdatengrundlage in Form einer wissenschaftlichen Publikation inklusive Persistent Identifier (PID) und einer Metadatenvalidierung ist in diesem Szenario angestrebt. Anschaulich gemacht wurde dies am Beispiel der Dissertation von Judith Lange über „Die Verslegende Veronica II“ in Form einer Hybridedition. Bei Veronica II handelt es sich um eine der frühesten überlieferten Verslegenden, die aufgrund der zahlreichen Fassungen, des großen Variantenreichtums und der umfangreichen, von Kontamination geprägten, Überlieferungslage lange als „unedierbar“ galt. Ziel der Dissertation war eine hybride Edition, die der komplexen Überlieferungssituation Rechnung würde tragen können. Daher ist die gedruckte Fassungsedition um eine Archivausgabe erweitert worden, die im TextGrid-Repository zugänglich ist. Die Archivausgabe umfasst Handschriftendigitalisate und in TEI-P5 ausgezeichnete Volltranskriptionen aller 18 Textzeugen und ermöglicht zugleich die Edierung inklusive Dokumentation der Arbeitsschritte. Insofern haben digitale Ergänzungen einige Vorteile, da sie den Text für verschiedene Benutzergruppen öffnen, das Spektrum der Textarbeit erweitern und dem Textverlust klassischer Printeditionen entgegenwirken. Es schloss sich eine Übung für die TeilnehmerInnen an, bei der textspezifische Ergänzungen in einer CSS-Datei entsprechend der Kriterien des vorgestellten Use-Cases vorgenommen wurden.

Nach der Mittagspause führte Hannes Riebl (Niedersächsische Staats- und Universitätsbibliothek Göttingen) das Veranstaltungsprogramm mit einem Vortrag über eXist, SADE und das Neologie-Portal fort. Im Vortrag von Mathias Göbel und Ubbo Veentjer (beide von der Niedersächsischen Staats- und Universitätsbibliothek Göttingen) über TextGrid und SADE fand das TextGrid-Nutzertreffen am zweiten Tag seinen Abschluss.

Ein besonderer Dank gilt den Vortragenden und allen interessierten Teilnehmerinnen und Teilnehmern, die dazu beigetragen haben, den Workshop zu einem Erfolg zu machen.

Das Programm, die Präsentationen und weiterführende Inhalte finden Sie unter: https://de.dariah.eu/ws